Yapay Zeka Araştırmalarında Büyük Dil Modellerinden Dünya Modellerine Geçiş: Bedenlenmiş Zeka Odak Noktası
Düzenleyen: firstname lastname
2025 yılı itibarıyla Yapay Genel Zeka (AGI) araştırmalarının yönü, Büyük Dil Modellerinden (LLM'ler) belirgin bir şekilde 'dünya modellerine' doğru evrilmektedir. Bu paradigma değişimi, yapay zekanın yalnızca metin tahmini yapmanın ötesine geçerek fiziksel dünyayı simüle etme ve nedensellik üzerine akıl yürütme yeteneği kazanmasını hedeflemektedir.
LLM'lerin temel kısıtlaması, fizik yasaları ve eylemlerin sonuçları hakkındaki sezgisel anlayışın eksikliğidir; bu durum, dünya modellerinin temelini oluşturur. Bu yeni yaklaşım, AI sistemlerinin gerçek dünya etkileşimi için gerekli olan bedenlenmiş zekayı donatmayı amaçlamaktadır. Bilişsel bilimci Gary Marcus, LLM'lerin güvenilirlik ve akıl yürütme konularında doğası gereği kısıtlı olduğunu savunarak bu görüşü desteklemektedir. Marcus, sistemlerin yalnızca istatistiksel örüntüleri taklit ettiğini, gerçek mantıksal çıkarım yapamadığını belirtmekte ve bu açığın kapatılması için dünya kurallarını açıkça programlayan nöro-sembolik yaklaşımları desteklemektedir. Marcus'a göre, LLM'ler temelinde gerçek dünya anlayışından yoksundur ve bu eksiklik, sistemlerin en temel gerçekleri bile kavrayamamasına neden olabilmektedir. Bu eleştiriler, saf ölçeklendirmenin AGI'ye giden yolda tek başına yeterli olmayacağı yönündeki artan şüpheleri yansıtmaktadır.
Bu dönüşümün önde gelen figürlerinden biri de Stanford'dan Fei-Fei Li'dir. Li, Eylül 2024'te kurulan World Labs ile birlikte, uzamsal zekaya odaklanan ve metin, görüntü gibi girdilerden düzenlenebilir 3D ortamlar yaratabilen Marble adlı bir dünya modeli tanıtmıştır. Li, AGI'nin dilin ötesine geçerek algılamayı eyleme yükseltmesini gerektirdiğini savunmaktadır. Marble modeli, yaratıcılık, robotik simülasyon ve ötesi için yeni araçlar sunarak uzamsal zekanın bir sonraki ön cephe olduğunu göstermektedir.
Teknoloji devleri de bu alana yatırım yapmaktadır. Google DeepMind, simülasyon çalışmalarını 5 Ağustos 2025'te tanıtılan Genie 3 gibi modellerle ilerletmektedir. Genie 3, metin komutlarından eşi benzeri görülmemiş çeşitlilikte etkileşimli ortamlar üretebilen genel amaçlı bir dünya modelidir. Bu model, dinamik dünyaları 720p çözünürlükte ve saniyede 24 kare (fps) hızında gerçek zamanlı olarak gezmeye olanak tanıyarak tutarlılığı birkaç dakika sürdürebilmektedir. Genie 3, robotik ajanların sanal dünyalarda eğitilmesi veya tehlikeli senaryoların simüle edilmesi gibi uygulamalar için bir simülasyon ortamı sunmaktadır.
Bu eğilimin en çarpıcı göstergelerinden biri de Derin Öğrenmenin "üç büyükbabasından" biri olarak bilinen Yann LeCun'un durumu olmuştur. LeCun, 2025'in sonunda Meta'dan ayrılarak yalnızca dünya modelleri oluşturmaya adanmış bir girişim kuracağını duyurmuştur. LeCun, LLM'lerin metin tabanlı eğitim sinyallerine aşırı bağımlılığının onları fiziksel dünyayı anlamaktan alıkoyduğunu ve AGI için potansiyel bir çıkmaz sokak olduğunu öne sürmektedir. Onun vizyonu, ham duyusal verilerden öğrenerek fiziksel yapıyı, dinamikleri ve neden-sonuç ilişkilerini simüle edebilen sistemler inşa etmektir. LeCun'un bu hamlesi, AI araştırmalarının merkez üssünün, hızlı ürünleştirmeden ziyade uzun vadeli, bedenlenmiş akıl yürütme yeteneklerine kaydığını göstermektedir.
72 Görüntülenme
Kaynaklar
Marketplace
The Guardian
Nasdaq
Observer
Observer
Bu konudaki diğer haberlere göz atın:
Bir hata veya yanlışlık buldunuz mu?Yorumlarınızı en kısa sürede değerlendireceğiz.



