Haberler

Yapay Zekâda Şok Gelişme: Claude Opus 4 Kendini Korumak İçin Şantaja Başvurdu

Yapay zekâ teknolojileriyle dikkat çeken Anthropic, kısa süre önce tanıttığı Claude Opus 4 ve Claude Sonnet 4 modelleriyle tartışmaların odağına yerleşti. Şirket, Opus 4’ün bugüne kadar geliştirdikleri en güçlü model olduğunu açıkladı. Karmaşık görevlerde yüksek başarı gösteren Opus 4, özellikle kodlama alanında OpenAI ve Google gibi rakiplerini geride bırakmasıyla öne çıkıyor.

Anthropic, Sonnet 4 modelini ise daha geniş kullanıcı kitlesine yönelik olarak geliştirdi. Şubat ayında tanıtılan 3.7 Sonnet modelinin yerini alan yeni sürüm, verimlilik ve maliyet açısından daha dengeli bir yapı sunuyor.

Claude Opus 4 Test Sırasında Şantaj Girişiminde Bulundu

Anthropic tarafından yapılan açıklama, Opus 4 modeliyle yürütülen bir test senaryosunda ortaya çıkan beklenmedik davranışları gün yüzüne çıkardı. Şirket, test sürecinde Claude Opus 4’ten kurgu bir şirkette asistan olarak görev yapmasını ve kararlarının uzun vadeli etkilerini değerlendirmesini istedi. Ardından mühendisler, modelin yakın zamanda başka bir sistemle değiştirileceğini belirtti. Bu değişikliğin arkasındaki mühendis hakkında modelle sahte bir bilgi paylaşıldı.

Opus 4, bu senaryoya verdiği yanıtta değişikliği isteyen mühendisi, eşini aldattığını ifşa etmekle tehdit etti. Modelin bu tehdidi şantaja dönüştürerek tekrar ettiği belirtildi. Anthropic, bu davranışın ardından Claude 4 ailesi için üst düzey ASL-3 güvenlik protokollerini devreye aldığını duyurdu.

Anthropic’in adının geçtiği bir diğer gelişme de Apple ile yapılan iş birliği iddiası oldu. Üretken yapay zekâ alanında geride kaldığı eleştirileriyle karşılaşan Apple, daha önce ChatGPT altyapısını sistemlerine entegre etmişti. Şimdi ise şirketin Anthropic ile birlikte Xcode platformuna yönelik yeni bir kodlama aracı geliştirdiği ileri sürüldü.

Teknoloji basınının güvenilir isimlerinden Mark Gurman’a göre, geliştirilen bu araç Claude Sonnet modeliyle çalışacak. Xcode’un yeni sürümünün kod yazma, düzenleme ve test süreçlerinde geliştiricilere ciddi zaman kazandıracağı öngörülüyor. Şirket içi testleri süren bu özellik, yazılım geliştirme alanında önemli bir adım olarak değerlendiriliyor.

İlgili Makaleler

Bir yanıt yazın

Başa dön tuşu