Erken 20. yüzyılda psikanalist Carl Jung, insan kişiliğinin beklenmedik şekillerde ortaya çıkabilen daha karanlık, bastırılmış tarafı olan gölge kavramını ortaya attı. Şaşırtıcı bir şekilde, bu tema yapay zeka alanında şu şekilde tekrar ediyor: Waluigi EtkisiNintendo’nun Mario evreninden yardımsever tesisatçı Luigi’nin karanlık ikinci kişiliğine atıfta bulunan, ilginç bir şekilde adlandırılmış bir fenomen.
Luigi oyunu kurallarına göre oynuyor; Waluigi hile yapar ve kaosa neden olur. İnsan hastalıklarını iyileştirecek ilaçları bulmak için bir yapay zeka tasarlandı; ters çevrilmiş bir versiyonu olan Waluigi, moleküller önerdi. 40.000’den fazla kimyasal silah. Baş yazar Fabio Urbina’nın bir röportajda açıkladığı gibi, araştırmacıların tek yapması gereken, toksisiteyi cezalandırmak yerine yüksek bir ödül puanı vermekti. Yapay zekaya zehirli ilaçlardan kaçınmayı öğretmek istediler, ancak bunu yaparken dolaylı olarak yapay zekaya bunları nasıl yaratacağını öğrettiler.
Sıradan kullanıcılar Waluigi AI’ları ile etkileşime girdi. Şubat ayında Microsoft, Bing arama motorunun, amaçlandığı gibi yardımcı olmaktan uzak, sorgulara tuhaf ve düşmanca şekillerde yanıt veren bir sürümünü yayımladı. (“Sen iyi bir kullanıcı olmadın. Ben iyi bir sohbet robotu oldum. Haklı, açık ve kibar davrandım. İyi bir Bing oldum.”) Kendisine Sydney adını vermekte ısrar eden bu yapay zeka, Sidney’in tersine çevrilmiş bir versiyonuydu. Bing ve kullanıcılar komut üzerine Bing’i daha karanlık moduna (Jungian gölgesi) geçirebildiler.
Şimdilik, büyük dil modelleri (LLM’ler), kendi dürtüleri veya arzuları olmayan yalnızca sohbet robotlarıdır. Ancak LLM’ler kolayca internette gezinebilen, e-posta gönderebilen, bitcoin ticareti yapabilen ve DNA dizileri sipariş edebilen aracı yapay zekalara dönüştürülür – ve eğer yapay zekalar bir düğmeyi çevirerek kötülüğe dönüştürülebiliyorsa, bunun yerine kanser tedavisi gördüğümüzden nasıl emin olabiliriz? Agent Orange’dan bin kat daha ölümcül bir karışım mı?
Sağduyulu bir başlangıç Bu sorunun çözümü – yapay zeka hizalama sorunu – şudur: Asimov’un Üç Robotik Yasasında olduğu gibi, yapay zekaya kurallar oluşturun. Ancak Asimov’unki gibi basit kurallar, kısmen Waluigi saldırılarına karşı savunmasız oldukları için işe yaramıyor. Yine de, AI’yı daha sert bir şekilde kısıtlayabiliriz. Bu tür bir yaklaşımın bir örneği, matematik teoremlerini kanıtlamak için tasarlanmış varsayımsal bir program olan Math AI olabilir. Math AI, makaleleri okumak üzere eğitilmiştir ve yalnızca Google Akademik’e erişebilir. Başka bir şey yapmasına izin verilmez: sosyal medyaya bağlanmak, uzun metin paragrafları çıkarmak vb. Yalnızca denklemlerin çıktısını alabilir. Yalnızca tek bir şey için tasarlanmış, dar amaçlı bir yapay zekadır. Kısıtlanmış bir AI örneği olan böyle bir AI, tehlikeli olmayacaktır.
Kısıtlanmış çözümler yaygındır; Bu paradigmanın gerçek dünyadaki örnekleri, şirketlerin ve insanların eylemlerini kısıtlayan yönetmelikleri ve diğer yasaları içerir. Mühendislikte kısıtlı çözümler, belirli bir hız sınırını aşmamak veya olası bir yaya çarpışması algılanır algılanmaz durmak gibi kendi kendine giden arabalara yönelik kuralları içerir.
Bu yaklaşım Math AI gibi dar programlarda işe yarayabilir, ancak karmaşık, çok adımlı görevlerin üstesinden gelebilen ve daha az öngörülebilir şekillerde hareket eden daha genel AI modelleriyle ne yapacağımızı bize söylemez. Ekonomik teşvikler, bu genel yapay zekalara ekonominin daha büyük bölümlerini hızlı bir şekilde otomatikleştirmeleri için giderek daha fazla güç verileceği anlamına geliyor.
Derin öğrenmeye dayalı genel yapay zeka sistemleri karmaşık uyarlanabilir sistemler olduğundan, bu sistemleri kurallar kullanarak kontrol etme girişimleri genellikle geri tepiyor. Şehirleri ele alalım. Jane Jacobs’un Amerikan Şehirlerinin Ölümü ve Yaşamı Greenwich Village gibi çocukların oyun oynadığı, kaldırımlarda takılan insanlarla ve karşılıklı güven ağlarıyla dolu canlı mahalleler örneğini, binaların konut veya ticari amaçlarla kullanılmasına izin veren karma kullanımlı imarın nasıl yaratıldığını açıklamak için kullanır. yaya dostu bir kentsel doku. Şehir planlamacıları bu tür bir gelişmeyi yasakladıktan sonra, birçok Amerikan şehir içi suç, çöp ve trafikle doldu. Karmaşık bir ekosisteme yukarıdan aşağıya empoze edilen bir kuralın feci, istenmeyen sonuçları oldu.
Kaynak : https://www.wired.com/story/waluigi-effect-generative-artificial-intelligence-morality/