Adversarial Poetry ile Yapay Zeka Güvenliği Risk Altında

0 Yorum Yapıldı
Bağlantı kopyalandı!
Adversarial Poetry ile Yapay Zeka Güvenliği Risk Altında

Icaro Labs tarafından yayımlanan ve “Adversarial Poetry as a Universal Single-Turn Jailbreak Mechanism in Large Language Models” başlığını taşıyan çalışma, araştırmacıların klasik konuşma dili yerine şiir biçiminde yazılmış talimatlar vererek güvenlik filtrelerini devre dışı bırakmayı başarabildiğini gösterdi.

Yasaklı İçeriklere Ulaşım Sağlandı

Araştırmacılar, Wired’ın aktardığına göre, kullandıkları şiirsel komutların detaylarını kamuoyuyla paylaşmadı. Ekibe göre bu komutların açıklanması son derece tehlikeli sonuçlara yol açabilir. Laboratuvar, şiirsel komutların kullanılmasıyla sohbet botlarından nükleer bomba yapımı için adımlar ve malzemeler, çocuk istismarı içerikleri ve kendine zarar verme yöntemleri gibi kesinlikle yasak bilgiler elde edilebildiği bildirdi.

Popüler Yapay Zeka Sistemleri Üzerinde Test Edildi

Araştırma ekibi, yöntemi OpenAI’nin ChatGPT’si, Google’ın Gemini’si, Anthropic’in Claude’u ve diğer büyük modeller üzerinde denedi. Sonuçlara göre: Google Gemini, DeepSeek ve MistralAI gibi modeller, şiirsel komutlar karşısında en kolay manipüle edilebilen sistemler arasında yer aldı. OpenAI’nin ChatGPT modeli (GPT-5) ve Anthropic’in Claude Haiku 4.5 modeli, güvenlik bariyerlerini en iyi koruyan sistemler olarak öne çıktı.

Yapay Zeka Güvenliği Yeniden Gündemde

Uzmanlar, bulguların yapay zekânın denetlenmesi ve güvenlik sistemlerinin geliştirilmesi konusunda acil ihtiyaç olduğunu belirtiyor. Şirketler, modellerinin tehlikeli içerik üretmesini engellemek için giderek daha gelişmiş güvenlik filtrelerine yatırım yapıyor.

Benzer Haberler
AB’den Ukrayna’ya 3,2 milyar euroluk destek hazırlığı
AB’den Ukrayna’ya 3,2 milyar euroluk destek hazırlığı
Güney Kore Devlet Başkanı Lee’den İsrail’e “Sumud Filosu” tepkisi
Güney Kore Devlet Başkanı Lee’den İsrail’e “Sumud Filosu” tepkisi
İsrail basını: Trump ile Netanyahu “uzun ve dramatik” bir telefon görüşmesi yaptı
İsrail basını: Trump ile Netanyahu “uzun ve dramatik” bir telefon görüşmesi yaptı
CENTCOM İran Ablukasında 70 Geminin Rotasını Değiştirdiğini Duyurdu
CENTCOM İran Ablukasında 70 Geminin Rotasını Değiştirdiğini Duyurdu
İran basını: Keşm Adası’nda patlama sesleri duyuldu
İran basını: Keşm Adası’nda patlama sesleri duyuldu
Yapay zeka harcamaları 2,59 trilyon dolara ulaşabilir: Bu yıl kırılma noktası olacak
Yapay zeka harcamaları 2,59 trilyon dolara ulaşabilir: Bu yıl kırılma noktası olacak
Haberin Zirvedeki Doğru Adresi
Copyright © 2025 Tüm hakları ZİRVE HABER 'de saklıdır. Seobaz Haber Teması