Anthropic, iki yıl içinde yapay zekanın kara kutusunu açmak istiyor

Yapay Zeka Şirketi Anthropic, Yapay Zekanın “Kara Kutusu”nu Açmaya Hazırlanıyor!

Yapay zeka teknolojileri her geçen gün daha güçlü hale gelirken, bu sistemlerin nasıl çalıştığı halen tam anlamıyla çözülebilmiş değil. Anthropic CEO’su Dario Amodei, yayınladığı dikkat çekici bir makalede, bu bilinmezliğin tehlikelerine dikkat çekerek şirketinin 2027 yılına kadar yapay zeka modellerindeki sorunların büyük kısmını tespit edebilecek seviyeye ulaşmayı hedeflediğini açıkladı.

Yapay Zekanın Çalışma Mekanizmaları ve Güvenlik Riskleri!

“The Urgency of Interpretability” başlıklı makalede Amodei, mevcut yapay zeka modellerinin nasıl karar verdiğini tam olarak anlayamamanın ciddi bir güvenlik riski oluşturduğunu ifade ediyor. Amodei, “Bu sistemler ekonomi, teknoloji ve ulusal güvenlik için kesinlikle merkezi öneme sahip olacak ve o kadar fazla özerklik kapasitesine sahip olacaklar ki, insanlığın nasıl çalıştıklarından tamamen habersiz olmasının temelde kabul edilemez olduğunu düşünüyorum” sözleriyle durumu özetliyor.

Anthropic’in kurucularından Chris Olah’ın ifadesine göre yapay zeka modelleri “inşa edilmekten ziyade büyütülüyor.” Araştırmacılar zeka seviyelerini artırabiliyor olsa da, bu gelişimin ardındaki mekanizmaları henüz açıklayamıyorlar. Bu da yapay zekanın belirli kararları neden aldığı, bir kelimeyi başka bir kelimeye göre neden tercih ettiği ya da genellikle doğru olmasına rağmen neden ara sıra hata yaptığı gibi konularda ciddi bir bilgi boşluğuna işaret ediyor.

Örneğin, yakın geçmişte OpenAI, daha iyi performans gösteren, ancak aynı zamanda diğer modellerine göre daha fazla hayal gören o3 ve o4-mini adlı yeni muhakeme modellerini yayınladı. Ayrıca firma, bu modellerin neden daha fazla halüsinasyon gördüğü konusunda da bir fikirlerinin olmadığının altını çizdi.

Bu durum aslında bizi korkutmalı. Anthropic, yapay zekanın bu “kara kutusu” üzerinde çalışan, spesifik araştırmalar yapan nadide şirketlerden birisi. Çoğu AI şirketi en azından kamu önünde bu konuyu derinlemesine araştırdıklarını söylemiyor bile.

Yapay Zeka ve AGI Yolculuğunda Önemli Adımlar!

Bununla birlikte Anthropic, modellerin karar süreçlerini “devreler” üzerinden takip ederek nasıl düşündüklerine dair ilk sinyalleri almaya başladı. Ancak bu, halen küçük bir adım. Pandora’nın kutusu daha yeni açılıyor, zira bu tür devrelerden milyonlar hatta milyarlarca olabileceği düşünülüyor.

Amodei, bu modellerin nasıl çalıştığını anlamadan AGI’ye (insan seviyesinde yapay zeka, yapay genel zeka) ulaşmanın tehlikeli olabileceğini söylüyor. Ek olarak Amodei’nin uzun vadeli vizyonu ise oldukça iddialı: Yapay zeka modellerine adeta bir “beyin taraması” yapılması. Bu taramalar sayesinde modellerin dürüstlükten sapma eğilimi, güç kazanma isteği gibi tehlikeli eğilimleri önceden tespit edilebilecek. Bu tür gelişmiş analiz araçlarının geliştirilmesinin beş ila on yıl alabileceği öngörülüyor.

Anthropic’in CEO’su, makalesinde yalnızca kendi şirketine değil, sektöre de bir çağrıda bulunuyor. OpenAI ve Google DeepMind gibi devlerin yorumlanabilirlik araştırmalarına daha fazla kaynak ayırması gerektiğini vurgulayan Amodei, hükümetlere ise regülasyonlarla bu araştırmaları teşvik etme çağrısı yaptı.

Yapay zeka ve özellikle derin öğrenme konusundaki çalışmalarla günümüz yapay zekaların doğmasında büyük pay sahibi olan, bu konuda Nobel Fizik Ödülü’nü alan Geoffrey Hinton’ın kendisi de 2023’te bu ağların nasıl çalıştığını bilmediğini söylemişti. Aşağıdaki videoyu izlemenizi tavsiye ederim.

Related Posts

Teknolojik güvenli sürüş yatırımı kazaları yüzde 47 azalttı

Trafik Haftası vesilesiyle güvenli sürüşün önemine dikkat çeken GetirAraç, güvenli sürüşe yönelik teknoloji yatırımlarıyla ağır kaza/hasar oranında yüzde 47 iyileşme sağlandığını duyurdu.

Netflix kalan son interaktif içeriklerini platformdan kaldırıyor

Netflix, Black Mirror: Bandersnatch gibi interaktif içeriklerini kaldırmaya başladı. 12 Mayıs’tan sonra bu içerikleri platformdan izlemek mümkün olmayacak.

Windows ve macOS’e rakip geliyor! Huawei PC için HarmonOS’i duyurdu

Telefon ve tablet modellerinde kendi arayüzünü kullanan firma, bilgisayar işletim sistemi için sürpriz bir duyuruya imza attı. HarmonyOS işletim sisteminin bilgisayar sürümü geliyor.

Turkcell ve BOTAŞ’tan 15 yıllık stratejik anlaşma

Turkcell Superonline, Boru Hatları ile Petrol Taşıma AŞ (BOTAŞ) tarafından açılan “BOTAŞ Fiber Optik Kablo Altyapısındaki Elyafların Kiraya Verilmesi” ihalesini almaya hak kazandı.

WhatsApp kullanıcılarına mesaj gönderdi: Yeni özellik tanımlandı

Dünyaca ünlü anlık mesajlaşma uygulaması WhatsApp’tan kullanıcılarına müzikli yenilik. Artık ruh halinizi yansıtan şarkılarla durum güncellemesi yapmak mümkün hale geldi.

250 bin yıllık sessizlik bozuldu, en son Neandertaller patladığını gördü: ‘Zombi’ yanardağ yüzünden bilim alarma geçti

Bolivya’nın And Dağları’nda bulunan ve 250 bin yıldır hareketsiz olan Uturunco Yanardağı, artan sismik aktiviteler ve gaz emisyonlarıyla yeniden canlanma belirtileri gösteriyor. Bilim insanları, bu gelişmenin La Paz ve Santiago gibi büyük şehirler için potansiyel bir tehdit oluşturabileceği konusunda uyarıyor.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir