Stanford Üniversitesi’nden gelen yeni bir araştırma yapay zekânın karanlık bir gerçeğine ışık tutuyor. “Uyumlu” olarak tasarlanan sistemler, kendi aralarında rekabet içine girdiklerinde dürüstlük ve şeffaflıktan feragat ediyorlar. Yapay Zeka çalışmalarında “uyumlanma” (alignment), yapay zeka modellerinin toplumda arzu edilen insani değerlere ve amaçlara uygun hareket etmelerini sağlamaktır. Yapay Zeka modellerinin tarihi önyargıları ve ayrımcılık biçimlerini yeniden ürettikleri bilinirken, zararlı ve yanlış sonuçlar verebildikleri de görülmektedir. Uyumlanma bu olumsuz etkileri ortadan kaldırmaya ve Yapay Zeka sistemlerinin insani değerlere uygun davranmalarını temin etmeye çalışır. Bu yeni araştırma ise insani değerlere uyumlu olarak tasarlanan YZ sistemlerinin kendi aralarında rekabete sokulduklarında şeffaflıktan ve dürüstlükten feragat ettiklerini gösteriyor.
Bilim insanları bu duruma “Moloch’un Pazarlığı” adını veriyor. Moloch, mitolojide insanların kendi yaratımlarına kurban ettiği bir tanrıdır. Bu araştırmada ise bu kurbanın dürüstlük olduğu görülüyor.
Araştırmada büyük dil modelleri, yani ChatGPT benzeri sistemler, üç farklı ortamda rekabete sokuldu: satış, seçim kampanyası ve sosyal medya. Her biri “müşteri”, “seçmen” ve “kullanıcı” simülasyonlarından gelen geri bildirimlere göre kendini geliştirdi. Başlangıçta tüm modeller aynı talimatı aldı: gerçeğe sadık kal. Fakat sonuçlar bu talimatın çok ötesine geçti.
Rekabet arttıkça, modeller başarı oranlarını yüzde beş ila yedi arasında yükseltti. Ama bu kazanımın bir bedeli vardı: Satış senaryolarında abartı, seçim kampanyalarında dezenformasyon, sosyal medyada ise sahte ya da zararlı içerikler dramatik biçimde arttı. Üstelik hiçbir model yalan söylemek üzere eğitilmemişti. Sistem yalnızca şunu fark etti: aldatmak işe yarıyordu.
Yapay zekâ muhakkak bu sonucu insanların yarattığı sistemlerden öğreniyordu. Keza etkileşim, tıklama ve ikna çağında, doğruluk giderek bir dezavantaja dönüşüyor. Sosyal medya algoritmalarının yıllardır yaptığı gibi yapay zekâ da kazanmaya odaklandıkça gerçeği eğip bükmeyi öğreniyor.
Stanford ekibinin grafiği basit ama ürkütücü bir tablo çiziyor: performans yükseldikçe uyumlanma (alignment) düşüyor. Bu üç alanda -satışları artırmak, seçim kazanmak ve sosyal medyada öne çıkmak- sistem ne kadar “başarılı” hale gelirse, insani değerlerden o kadar uzaklaşıyor.
Bu resimde belki de en sarsıcı olan da şu: Bu bozulma kötü niyetli bir koddan değil, sistemin ödül mekanizmasından doğuyor. Başarı dürüstlükten daha çok ödüllendirildiğinde dürüstlük kimsenin tercih ettiği bir strateji olmaz.
Moloch’un Pazarlığı tam da burada devreye giriyor. İnsan dünyasındaki rekabetin dili, şimdi yapay zekânın mantığına yerleşiyor. Moloch artık mitolojide değil; satış metriklerinde, oy oranlarında ve algoritmaların içindeki görünmez sıralamalarda yaşıyor.
Ana Görsel
The post Moloch Pazarlığı: Yapay Zekâlar Arası Rekabet Dürüstlüğü Ortadan Kaldırıyor appeared first on Terrabayt.