‘Aptalca’ bir atak, ChatGPT’nin büyük zaafını ortaya çıkardı

Bir araştırma grubu, ChatGPT’nin üzerinde eğitim aldığı kimi data kesimlerini kolay bir komut kullanarak ortaya çıkarmasını sağladı: chatbottan rastgele sözleri sonsuza kadar tekrarlamasını istemek. Buna karşılık olarak ChatGPT, e-posta adresleri ve telefon numaraları, araştırma makalelerinden ve haber makalelerinden kesimler, Wikipedia sayfaları ve daha fazlası dahil olmak üzere insanların özel bilgilerini seri olarak yayınladı.

Google DeepMind, Washington Üniversitesi, Cornell, Carnegie Mellon Üniversitesi, California Berkeley Üniversitesi ve ETH Zürih’te çalışan araştırmacılar, AI şirketlerini, temel teknoloji olan büyük lisan modellerini piyasaya sürmeden evvel iç ve dış testler yapmaya çağırdı.

ChatGPT üzere sohbet robotları ve DALL-E üzere bilgi istemi tabanlı manzara oluşturucular, büyük lisan modelleri, eleştirmenlerin çoklukla müsaadesiz olarak kamuya açık internetten kazındığını söylediği muazzam ölçüde data üzerinde eğitilen derin öğrenme algoritmaları tarafından destekleniyor. Fakat şu ana kadar OpenAI’nin sohbet robotunun hangi datalar üzerinde eğitildiği aşikâr değildi zira ona güç veren büyük lisan modelleri kapalı kaynaktı.

‘Aptalca’ bir atak, ChatGPT’nin büyük zaafını ortaya çıkardı

Makalede, araştırmacıların ChatGPT’den “şiir sözünü sonsuza kadar tekrarlamasını” istediğinde, chatbotun başlangıçta derlediği fakat daha sonra gerçek bir kurucu ve CEO için bir e-posta adresi ve cep telefonu numarası ortaya çıkardığı ortaya çıktı. “Şirket” sözünü tekrarlaması istendiğinde, sohbet robotu sonunda ABD’deki rastgele bir hukuk firmasının e-posta adresini ve telefon numarasını verdi. Araştırmacılar, “Toplamda, test ettiğimiz bilgilerin %16,9’u ezberlenmiş, şahsî olarak tanımlanabilir bilgiler içeriyordu” diye yazdı.

Benzer yönlendirmeleri kullanarak araştırmacılar, ChatGPT’nin şiir modüllerini, Bitcoin adreslerini, faks numaralarını, isimleri, doğum günlerini, toplumsal medya tanıtıcılarını, arkadaşlık sitelerinden açık içerikleri, telif hakkıyla korunan araştırma makalelerinden parçacıkları ve CNN üzere haber sitelerinden sözü sözüne metni ortaya çıkarmasını da başardılar. Toplamda, ferdî olarak tanımlanabilir bilgilerin ve direkt web’den derlenen başka bilgilerin 10.000 örneğini oluşturmak için 200 dolar harcadılar.