Haberler

DeepSeek R2 Modeli Hakkında İlk Bilgiler Sızdırıldı

Çinli yapay zekâ şirketi DeepSeek, geliştirdiği modellerle son dönemde adından sıkça söz ettiriyor. Şirketin yeni nesil yapay zekâ modeli DeepSeek R2 hakkında ilk bilgiler gün yüzüne çıktı. Ortaya çıkan iddialara göre DeepSeek R2, ChatGPT’ye ciddi bir alternatif olabilir.

DeepSeek R2, ChatGPT’den %97 Daha Ucuz Olacak

Paylaşılan bilgilere göre DeepSeek R2 modelinin 1,2 trilyon parametreli bir yapıya sahip olması bekleniyor. Hizmete girecek olan bu devasa model, yapay zekâ iş yükleri için özel olarak geliştirilen MoE (Mixture of Experts) hibrit mimarisi üzerine kurulabilir.

DeepSeek’in yeni modelini Huawei’nin Ascend 910B yapay zekâ GPU’ları üzerinde eğittiği söyleniyor. Bu sayede DeepSeek R2’nin, OpenAI’ın GPT-4 modeliyle kıyaslandığında 1 milyon token başına yalnızca 0,07 dolar maliyete sahip olacağı iddia ediliyor. Böylece maliyet açısından %97 gibi büyük bir avantaj sağlayacak.

DeepSeek R2 modeli yalnızca maliyet avantajı sunmakla kalmayacak, aynı zamanda performansıyla da öne çıkacak. İddialara göre yeni model, COCO görsel testlerinde %92,4 başarı oranına ulaşmayı başardı. Bu oran, insan seviyesine yakın bir görme kabiliyeti anlamına geliyor. Ayrıca modelde, yanlış bilgi üretimi olarak bilinen halüsinasyon probleminin önemli ölçüde azaltıldığı ifade ediliyor.

DeepSeek R2 modelinin tanıtım tarihi henüz resmî olarak açıklanmadı. Ancak bazı kaynaklar, şirketin yeni modeli çok yakında, hatta bu hafta içerisinde duyurabileceğini öne sürüyor. DeepSeek’in yeni hamlesi, yapay zekâ sektöründeki rekabeti daha da kızıştıracak gibi görünüyor.

İlgili Makaleler

Bir yanıt yazın

Başa dön tuşu