Çin merkezli yapay zeka şirketi DeepSeek, yeni nesil R2 yapay zeka modelini geliştiriyor. Bu modelle ilgili ortaya çıkan ilk bilgiler oldukça dikkat çekici.
Öne çıkan bir iddia, DeepSeek R2’nin eğitim maliyetinin, sektördeki önemli oyunculardan OpenAI’nin GPT-4 modeline göre yüzde 97 oranında daha düşük olabileceği yönünde.
Ayrıca, bu eğitimin Huawei’nin Ascend 910B yapay zeka GPU’ları kullanılarak gerçekleştirilmiş olduğu belirtiliyor.
MALİYET AVANTAJI
DeepSeek R2’nin, önceki R1 modelinin parametre sayısını iki katına çıkararak toplamda 1.2 trilyon parametreye sahip olacağı ifade ediliyor.
Maliyet açısından ise, GPT-4’e oranla yüzde 97,3 daha ucuz olduğu iddia ediliyor. Eğer bu rakamlar doğruysa, DeepSeek R2, piyasada en ekonomik yapay zeka modellerinden biri olma potansiyeline sahip olacak ve özellikle kurumsal kullanımlar için cazip bir alternatif sunacak.
Söylentilere göre, DeepSeek R2’nin eğitimi sırasında Huawei’nin Ascend 910B yapay zeka çip kümesinden yüzde 82 oranında bir kullanım verimliliği sağlandığı bildiriliyor.
Bu durum, DeepSeek’in yeni modeli için yerel kaynakları etkili bir şekilde kullandığını gösteriyor. Huawei yapay zeka çiplerinin kullanılması, DeepSeek’in yapay zeka tedarik zincirini kendi modeline entegre etmesine ve dışa bağımlılığı azaltmasına imkan tanıyor.