L'IA délaisse les LLM pour les Modèles du Monde en quête d'Intelligence Incarnée

Édité par : firstname lastname

La recherche en Intelligence Artificielle Générale (IAG) en 2025 observe un changement stratégique notable, s'orientant des Grands Modèles de Langage (LLM) vers les « modèles du monde » (world models). Cette orientation répond à une limitation fondamentale des LLM: malgré leur maîtrise linguistique, ils manquent d'une compréhension intrinsèque des lois de la physique et de la causalité du monde réel. Les modèles du monde sont conçus pour permettre aux systèmes d'IA de simuler et de raisonner sur l'environnement physique, une capacité jugée essentielle pour une interaction concrète avec le réel.

Ce virage est soutenu par des figures influentes du secteur. Le scientifique cognitif Gary Marcus, critique historique des LLM, continue de plaider pour des architectures neuro-symboliques intégrant explicitement les règles du monde, arguant que la fiabilité et les capacités de raisonnement des LLM sont intrinsèquement bornées. Parallèlement, Fei-Fei Li, pionnière de l'IA et cofondatrice de World Labs, a présenté Marble. Ce modèle du monde, centré sur l'intelligence spatiale, vise à faire passer la perception au stade de l'action, une nécessité pour l'avènement de l'IAG. Lancé par World Labs, fondé en septembre 2024, Marble peut convertir des invites textuelles, des images ou des vidéos en univers 3D persistants et éditables, une avancée que Li qualifie de significative pour l'ère de l'IA générative.

Les principaux acteurs technologiques investissent massivement dans cette nouvelle direction. Google DeepMind poursuit ses efforts de simulation avec des itérations telles que Genie 3, un modèle du monde générant des environnements 3D interactifs à partir de texte ou d'images, progressant vers l'IAG grâce à des simulations illimitées. L'architecture auto-régressive de Genie 3 lui confère une cohérence en mémorisant les contenus générés jusqu'à une minute. Simultanément, Yann LeCun, après douze années chez Meta, a quitté l'institution pour fonder une startup entièrement dédiée à la construction de modèles du monde, considérant les LLM comme une impasse pour l'intelligence incarnée. LeCun et d'autres partisans estiment que cette nouvelle génération de systèmes d'IA pourrait nécessiter une décennie pour atteindre sa pleine maturité.

Le consensus croissant en faveur de l'intelligence incarnée souligne la demande pour des systèmes d'IA dépassant la simple prédiction textuelle pour interagir de manière sophistiquée avec le réel. L'intelligence spatiale, définie comme la capacité à percevoir, modéliser, raisonner et agir dans un espace physique, est considérée comme le fondement de la cognition humaine, contrastant avec la nature unidimensionnelle du signal génératif du langage. Des modèles comme Marble emploient des techniques telles que les Gaussian splats pour générer ces mondes, permettant un contrôle précis de la caméra et une édition interactive, ce qui présente un intérêt pour les studios VFX et les développeurs de jeux. L'enjeu est de faire évoluer l'IA de la corrélation statistique, domaine d'excellence des LLM, vers un raisonnement causal authentique, en attribuant des propriétés physiques aux simulations. Le passage aux modèles du monde est perçu comme une nécessité pour surmonter les limites observées dans le raisonnement complexe, comme l'a indiqué une étude récente d'Apple. L'objectif de l'IAG dépend désormais de la capacité des machines à simuler et comprendre la dynamique du monde physique, une compétence que les LLM seuls ne peuvent fournir.

72 Vues

Sources

  • Marketplace

  • The Guardian

  • Nasdaq

  • Observer

  • Observer

Avez-vous trouvé une erreur ou une inexactitude ?Nous étudierons vos commentaires dans les plus brefs délais.