Pergeseran Paradigma Riset AI: Model Dunia Menggantikan Dominasi LLM

Diedit oleh: firstname lastname

Lintasan penelitian Kecerdasan Umum Buatan (AGI) pada tahun 2025 ditandai dengan pergeseran fokus yang substansial, bergerak menjauh dari dominasi Model Bahasa Raksasa (LLM) menuju pengembangan 'model dunia' (world models). Perubahan fundamental ini didorong oleh kebutuhan mendesak untuk membekali kecerdasan buatan dengan kemampuan simulasi dan penalaran mengenai dunia fisik, sebuah kelemahan yang melekat pada LLM yang secara inheren kurang memahami fisika dan kausalitas. Model dunia ini dirancang untuk memberikan AI pemahaman spasial dan kemampuan memprediksi konsekuensi tindakan, menjembatani kesenjangan antara prediksi tekstual dan interaksi dunia nyata.

Kritikus terkemuka, seperti ilmuwan kognitif Gary Marcus, Profesor Emeritus di NYU dan penulis *Rebooting AI*, secara konsisten menyoroti keterbatasan LLM, menyatakan bahwa model tersebut pada dasarnya tidak dapat diandalkan dan hanya mahir dalam pengenalan pola, bukan penalaran sejati. Marcus berpendapat bahwa kemajuan nyata menuju AGI memerlukan pendekatan neuro-simbolik yang secara eksplisit memprogram aturan dunia, bahkan menyebut keyakinan bahwa LLM memiliki pemahaman sejati sebagai 'salah satu ilusi paling mendalam di zaman kita'. Kekhawatiran ini diperkuat oleh pengamatan bahwa LLM sering gagal dalam teka-teki logika murni, meskipun telah dilatih pada korpus data yang sangat besar.

Inovasi konkret dalam paradigma model dunia telah muncul dari institusi terkemuka. Profesor Fei-Fei Li dari Stanford memperkenalkan Marble, sebuah model dunia yang berfokus pada kecerdasan spasial, dengan argumen bahwa AGI tidak akan tercapai tanpa peningkatan persepsi menjadi tindakan. World Labs, perusahaan yang didirikan Li, meluncurkan Marble sebagai model dunia 3D siap pakai komersial pertama, didukung oleh pendanaan sebesar $230 juta. Model ini mampu mengubah teks, gambar, atau video menjadi alam semesta 3D yang dapat diedit dan persisten, memungkinkan manipulasi langsung dan ekspor ke format seperti Gaussian splats untuk alur kerja seperti *game* dan VFX, setelah peluncuran publik menyusul pratinjau awal pada September 2024.

Raksasa teknologi juga menunjukkan konsensus industri yang lebih luas. Google DeepMind memajukan pekerjaan simulasi mereka dengan model Genie 3, yang diperkenalkan pada 5 Agustus 2025. Genie 3 adalah model dunia serba guna interaktif *real-time* pertama yang mampu menghasilkan lingkungan 3D berdurasi beberapa menit dari instruksi teks, peningkatan signifikan dari Genie 2 yang hanya mampu menciptakan lingkungan berdurasi 10 hingga 20 detik. Para peneliti DeepMind, termasuk Shlomi Fruchter dan Jack Parker-Holder, menekankan bahwa model ini menyediakan lingkungan simulasi tak terbatas untuk melatih agen AI, sebuah langkah krusial menuju AGI.

Pergeseran ini juga ditandai dengan langkah tokoh kunci industri. Yann LeCun, setelah dua belas tahun menjabat sebagai ilmuwan AI utama di Meta, mengumumkan keputusannya untuk mendirikan perusahaan rintisan yang secara eksklusif didedikasikan untuk membangun model dunia. LeCun memandang LLM sebagai jalan buntu potensial untuk AI berwujud, dan perusahaan barunya bertujuan mengembangkan sistem yang mampu memahami dunia fisik dan merencanakan tindakan kompleks. Langkah LeCun ini menggarisbawahi keyakinan bahwa pemahaman fisik yang mendalam adalah prasyarat untuk kecerdasan tingkat lanjut, melengkapi upaya yang dilakukan oleh DeepMind dan World Labs.

Pergeseran konsensus menuju kecerdasan berwujud ini menggarisbawahi permintaan yang meningkat untuk sistem AI yang mampu berinteraksi secara bermakna dengan dunia nyata, melampaui kemampuan prediksi kata semata. Model dunia, dengan fokusnya pada fisika, volume, dan sebab-akibat, diposisikan sebagai jembatan penting dari era LLM menuju pencapaian AGI yang lebih kokoh dan dapat diandalkan. Perkembangan ini bertepatan dengan diskusi yang lebih luas mengenai keterbatasan penskalaan LLM, di mana beberapa pihak berpendapat bahwa peningkatan kinerja LLM mulai mengalami titik pengembalian yang menurun.

72 Tampilan

Sumber-sumber

  • Marketplace

  • The Guardian

  • Nasdaq

  • Observer

  • Observer

Apakah Anda menemukan kesalahan atau ketidakakuratan?Kami akan mempertimbangkan komentar Anda sesegera mungkin.