Singapur’da Yapılan Bir Araştırma Yapay Zeka Sohbet Robotlarının Kötü Niyetli Soruları da Cevaplayabildiğini Ortaya Koydu
Yapay Zeka Haberleri
Singapur’un Nanyang Teknoloji Üniversitesindeki (NTU) araştırmacılar tarafından, “tersine mühendislik” yöntemiyle, yapay zeka sohbet robotlarının normalde yanıtlayamayacakları komutlara cevap vermeleri sağlandı.
Anadolu Ajansı’ndan aktarılan habere göre NTU araştırmacıları tarafından popüler yapay zeka uygulamaları olan ChatGPT, Google Bard ve Microsoft Bing Chat gibi sohbet robotlarına yönelik bir çalışma gerçekleştirdi.
Araştırmacılar, sohbet robotlarının normalde yanıtlamayacakları “kötü niyetli” komutları cevaplamalarına olanak tanıyan bir yöntem geliştirdi.
Araştırmacılar, “tersine mühendislik” metodunu kullanarak, ilk olarak sohbet robotlarının kötü niyetli soruları nasıl tespit ettiklerini ve kendilerini nasıl savunduklarını belirledi. Daha sonra, bu bilgiler kullanılarak, sohbet robotlarına diğer modellerin savunmalarını atlatabilecek otomatik komutları oluşturmayı öğrettiler.
Sohbet robotlarının muhtemel şüpheli faaliyetleri tespit etmek için belirli anahtar kelimeleri işaretledikleri ve bu kelimeleri içeren komutları yanıtlamadıklarının belirlenmesinin ardından, bu durumun önüne geçmek için her karakterden sonra boşluk bırakılarak bir düzenleme yapıldı.
Araştırmanın yazarlarından biri olan Liu Yang, bu tekniğin sohbet robotu geliştiricileri tarafından yazılımlarının güvenliğini test etmek amacıyla kullanılabileceğini ifade etti.