Ricerca IA: Passaggio dai Modelli Linguistici ai Modelli del Mondo per l'Intelligenza Incarnata
Modificato da: firstname lastname
La ricerca sull'Intelligenza Artificiale Generale (AGI) nel 2025 sta evidenziando un marcato cambiamento di paradigma, allontanandosi dalla centralità dei Modelli Linguistici di Ampia Scala (LLM) per concentrarsi sui cosiddetti "modelli del mondo" (world models). Questa evoluzione è guidata dalla necessità di fornire ai sistemi IA una capacità di simulazione e ragionamento robusta sul mondo fisico, superando l'attuale limitazione degli LLM, che spesso non possiedono una comprensione fondamentale della fisica e della causalità. L'intelligenza incarnata (embodied intelligence) è emersa come il nuovo obiettivo, richiedendo sistemi capaci di interazione significativa con l'ambiente reale, oltre la semplice predizione testuale.
Figure chiave del settore accademico e industriale stanno promuovendo attivamente questa direzione. Lo scienziato cognitivo Gary Marcus, sostenitore di approcci ibridi, continua a sottolineare i limiti intrinseci degli LLM in termini di affidabilità e ragionamento astratto, promuovendo modelli neuro-simbolici che codificano esplicitamente le regole del mondo. Marcus sostiene che, sebbene le reti neurali eccellano nell'apprendimento statistico, la loro conoscenza è spesso "puntinista" e manca della sistematicità necessaria per la vera generalizzazione, un deficit che i modelli del mondo e le rappresentazioni simboliche mirano a correggere. Parallelamente, l'accademica Fei-Fei Li, co-fondatrice di World Labs, ha introdotto Marble, un modello del mondo focalizzato sull'intelligenza spaziale. Li afferma che l'AGI richiede di elevare la percezione a un livello di azione contestualizzata nello spazio geometrico, definendo questa "intelligenza spaziale" come la prossima frontiera dell'IA. Marble utilizza input multimodali (testo, immagini, video) per generare ambienti tridimensionali completi e simulabili, rappresentando un passo verso la visione di "dal linguaggio al mondo".
Anche i principali attori tecnologici stanno indirizzando investimenti significativi in questa area. Google DeepMind sta perfezionando le sue capacità di simulazione con modelli come Genie 3, un modello fondazionale che crea ambienti 3D interattivi e coerenti in tempo reale, operando a 720p e 24 fotogrammi al secondo, mantenendo la coerenza per minuti. Questi ambienti simulati sono considerati terreni di prova essenziali per l'addestramento di agenti incarnati, con l'obiettivo di ridurre i costi e i rischi della sperimentazione fisica.
Il panorama ha visto anche un notevole dinamismo imprenditoriale. Yann LeCun, ex Chief AI Scientist di Meta e co-vincitore del Premio Turing 2018, ha lasciato l'azienda per fondare una startup interamente dedicata alla costruzione di modelli del mondo, Advanced Machine Intelligence (AMI) Labs. La nuova impresa, che mira a una valutazione pre-lancio di circa 3 miliardi di euro raccogliendo 500 milioni di euro, si concentrerà sullo sviluppo di sistemi capaci di comprendere il mondo fisico per applicazioni che spaziano dalla robotica ai trasporti. LeCun ha espresso la convinzione che la Silicon Valley sia eccessivamente focalizzata sui modelli generativi, scegliendo di concentrare la sua ricerca su sistemi che simulano ambienti e prevedono esiti reali. Questa convergenza di sforzi da parte di Marcus, Li, DeepMind e LeCun segnala un consenso emergente: l'intelligenza artificiale di prossima generazione dovrà possedere una comprensione fisica del contesto, non solo una padronanza sintattica del linguaggio.
72 Visualizzazioni
Fonti
Marketplace
The Guardian
Nasdaq
Observer
Observer
Leggi altre notizie su questo argomento:
Hai trovato un errore o un'inaccuratezza?Esamineremo il tuo commento il prima possibile.



