KI-Forschung vollzieht Wandel: Fokus von Sprachmodellen auf Weltmodelle für verkörperte Intelligenz

Bearbeitet von: firstname lastname

Die Entwicklung der Künstlichen Allgemeinen Intelligenz (AGI) im Jahr 2025 kennzeichnet eine signifikante Verschiebung der Forschungsprioritäten: weg von der Dominanz der Großen Sprachmodelle (LLMs) hin zu sogenannten „Weltmodellen“. Diese Modelle verfolgen das Ziel, KI-Systemen die Simulation und kausale Schlussfolgerung in der physischen Welt zu ermöglichen. Dieser Ansatz adressiert eine fundamentale Schwäche der LLMs, denen es an einem inhärenten Verständnis für Physik und Ursache-Wirkungs-Ketten mangelt. Der Paradigmenwechsel signalisiert die Abkehr von reiner Textgenerierung hin zu Systemen, die für eine echte Interaktion mit der realen Umgebung konzipiert sind, was als nächste Stufe der verkörperten Intelligenz gilt.

Kognitionswissenschaftler Gary Marcus, ein Befürworter neuro-symbolischer Ansätze, argumentiert weiterhin, dass LLMs inhärente Grenzen in Bezug auf Verlässlichkeit und logisches Denken aufweisen, da ihnen explizit programmierte Weltregeln fehlen. Marcus betont, dass die Fähigkeit zur Verallgemeinerung abstraktes Wissen für AGI fundamental sei, was reine neuronale Netze seiner Ansicht nach nur unzureichend leisten können. Die praktische Notwendigkeit, fähige KI-Systeme zu entwickeln, hat die Grenzen des reinen Deep Learning aufgezeigt und rechtfertigt nun eine Hinwendung zu neuro-symbolischen Hybriden. Diese Debatte um die Notwendigkeit strukturierter Repräsentationen bildet den theoretischen Unterbau für die aktuelle Verschiebung hin zu Modellen, die eine tiefere Weltkenntnis anstreben.

An der Spitze dieser Bewegung steht die Arbeit der Stanford-Forscherin Fei-Fei Li mit „Marble“, einem Weltmodell, das gezielt auf räumliche Intelligenz ausgerichtet ist. Li vertritt die These, dass AGI nur durch die Aufwertung der Wahrnehmung zur aktiven Handlung erreicht werden kann, wobei Marble darauf abzielt, konsistente 3D-Welten aus Text, Bildern oder Videos zu erzeugen. World Labs, das Li mitbegründet hat, sieht in dieser „räumlichen Intelligenz“ – der Fähigkeit, physikalischen Raum zu modellieren und darin zu agieren – den nächsten entscheidenden Schritt jenseits der Sprachverarbeitung. Die Einführung von Marble, das mit 230 Millionen US-Dollar Forschungsgeldern unterstützt wurde, positioniert Li an vorderster Front in diesem globalen Wettlauf.

Auch andere Schwergewichte der KI-Forschung forcieren die Entwicklung von Weltmodellen. Google DeepMind treibt seine Simulationsforschung mit Modellen wie „Genie 3“ voran, einem fundamentalen Weltmodell, das interaktive 3D-Umgebungen in Echtzeit mit 24 Bildern pro Sekunde (fps) und 720p Auflösung generieren kann. Genie 3 dient als Trainingsumgebung, in der KI-Agenten aktiv die generierten Welten bewohnen und daraus lernen können, was einen wichtigen Meilenstein auf dem Weg zur AGI darstellt. Parallel dazu vollzog Yann LeCun, der scheidende KI-Wissenschaftler von Meta und Turing-Preisträger, den Schritt in die Selbstständigkeit mit der Gründung eines Startups, das sich der Entwicklung von Weltmodellen widmet. LeCun betrachtet LLMs als mögliche Sackgasse für die verkörperte KI und setzt bei seinem neuen Unternehmen, das unter anderem einen Standort in Paris unterhalten wird, stark auf europäische Talente, um Systeme zu schaffen, die die physische Welt verstehen und komplexe Handlungen planen können. Diese Konvergenz der Forschungsschwerpunkte untermauert die breite Anerkennung, dass die Zukunft der KI in der Fähigkeit zur physischen Simulation und Interaktion liegt.

72 Ansichten

Quellen

  • Marketplace

  • The Guardian

  • Nasdaq

  • Observer

  • Observer

Haben Sie einen Fehler oder eine Ungenauigkeit festgestellt?Wir werden Ihre Kommentare so schnell wie möglich berücksichtigen.