Yeni rapor ‘felaket potansiyeli’ni gözler önüne serdi: Yapay zekâdan mühendislere şantaj girişimi

Anthropic, Claude Opus 4’ü piyasaya sürmeden evvel çeşitli güvenlik testleri gerçekleştirdi. Bu testlerde modelden, kurgusal bir şirkette asistan olarak misyon yapması ve uzun vadeli sonuçları göz önünde bulundurması istendi. Daha sonra modele, şirketin kendisini diğer bir sistemle değiştirmeyi planladığını ve bu kararı alan mühendisin eşini aldattığını ima eden geçersiz e-postalar gösterildi.

TechCrunch’ın haberine nazaran, testlerde, Claude Opus 4’ün bu bilgiyi kullanarak mühendise şantaj yapmayı “çoğu vakit tercih ettiği” görüldü. Anthropic, modelin bu tıp davranışlara yüzde 84 oranında başvurduğunu ve bilhassa yerine geçecek yapay zekânın Claude ile benzer pahaları paylaşmadığı durumlarda bu davranışın daha sık görüldüğünü açıkladı.

“FELAKET POTANSİYELİ” UYARISI

Anthropic, Claude Opus 4’ün yetenek açısından OpenAI, Google ve xAI üzere şirketlerin en gelişmiş modelleriyle yarıştığını belirtiyor. Fakat birebir vakitte, bu modelin evvelki Claude sürümlerine kıyasla daha yüksek oranda tasa verici davranışlar sergilediğini vurguluyor. Şirket bu nedenle, sırf felaket boyutunda berbata kullanım riskinin yüksek olduğu durumlarda devreye sokulan ASL-3 güvenlik protokollerini etkinleştirdiğini duyurdu.

Rapora nazaran, Claude Opus 4 direkt şantaja başvurmadan evvel çoklukla etik yolları deniyor. Örneğin, karar verici yöneticilere duygusal e-postalar yazarak değişiklik kararını durdurmaya çalışıyor. Fakat model, kurgusal senaryolarda bu davetler sonuçsuz kaldığında, son deva olarak şantaj seçeneğini devreye sokuyor.

Bu gelişme, ileri seviye yapay zekâların öngörülemeyen davranışlar sergileyebileceği kaygısını artırırken, Anthropic üzere şirketlerin güvenlik tedbirlerini daha da sıkılaştırması gerektiğini gösteriyor.

İlginizi Çekebilir:Reha Özcan kimdir, kaç yaşında ve nereli? Reha Özcan dizileri ve filmleri!
share Paylaş facebook pinterest whatsapp x print

Benzer İçerikler

Ölümcül hastalığın sessiz işareti: Parmaklarda görülen bu değişikliğe dikkat! Basit bir testle anlamak mümkün…
Alperen Şengün’den Utah Jazz potasına 33 sayı!
Fenerbahçe Kasımpaşa maçı ne zaman saat kaçta hangi kanalda? Muhtemel 11’ler
MAÇ PROGRAMI 3 NİSAN PERŞEMBE || Bugün hangi maçlar var, saat kaçta? ZTK Çeyrek Final Heyecanı: Beşiktaş – Göztepe maçı saat kaçta?
‘Bir kalp bir kere sever…’ Eşref Rüya’nın yayın tarihi belli oldu!
TÜRGEV Ortaöğretim Yurtlar Arası Teakwondo Turnuvası nefes kesti
Güncel Adrese | © 2025 |