LLMからワールドモデルへ：具現化された知能研究の焦点移行

12:25, 19 12月

編集者： firstname lastname

iframe { display: none; }

2025年の人工汎用知能（AGI）研究の動向は、大規模言語モデル（LLM）から「ワールドモデル」へと明確な方向転換を示している。このパラダイムシフトは、単なるテキストの予測を超え、AIが物理世界をシミュレートし、因果関係を理解する能力の獲得を目指す動きを象徴している。LLMが本質的に不足している物理法則や因果的推論の理解を補完することが、次世代AIの鍵と見なされている。

認知科学者のゲイリー・マーカス氏は、LLMの信頼性と推論能力には根本的な限界があると一貫して主張しており、ワールドのルールを明示的にプログラムするニューロシンボリックアプローチを提唱している。マーカス氏は、スケーリング則のみに頼るアプローチを批判し、因果関係と世界モデル、そしてニューロシンボリックAIの時代が到来したと述べている。これは、AIが抽象的な原理を真に理解し、訓練分布外のデータに一般化する能力が不可欠であるという認識に基づいている。

この流れを具体化する動きとして、スタンフォード大学のフェイフェイ・リー教授は、空間知能に焦点を当てたワールドモデル「Marble」を発表した。リー教授は、AGIの実現には知覚を知覚から動作へと高めることが不可欠であると論じ、Marbleは単なる3D作成ツールの域を超え、空間知能時代の幕開けを象徴していると位置づけている。Marbleは、単一の画像やテキストプロンプトから完全な構造と詳細を持つ3Dワールドを再構築し、UnrealやUnityなどのクリエイティブツールへ直接エクスポート可能な形式（ガウシアン・スプラッティング、三角メッシュ、動画）をサポートする。

一方、Google DeepMindは、シミュレーション研究をさらに推進し、テキストプロンプトからリアルタイムでインタラクティブな3D環境を生成する汎用ワールドモデル「Genie 3」を公開した。Genie 3は、720pの解像度で毎秒24フレーム（24fps）の動的ワールドを数分間維持する一貫性を持ち、AIエージェントが実時間でナビゲートし、学習するための仮想的な訓練場を提供する。DeepMindは、Genie 3をAGIへの重要なマイルストーンと見なしており、エージェントがデータに反応するだけでなく、シミュレートされた経験を通じて進化する道筋を示している。

さらに、この分野の重要性は、主要な研究者がLLMの限界を認識し、ワールドモデルに注力していることからも明らかである。Metaの元主任AI科学者であったヤン・ルカン氏は、LLMをAGI達成の潜在的な行き詰まりと見なし、ワールドモデルの構築に専念するためMetaを退社した。ルカン氏は、テキストベースの学習信号への依存が現実の多感覚的な豊かさを欠いていると指摘し、彼の新興企業であるAdvanced Machine Intelligence Labs（AMI Labs）は、ロボティクスや輸送をターゲットに物理世界をシミュレートするAIシステムに注力する。AMI Labsはパリを拠点とし、2026年1月のローンチを目指しており、初期資金調達として30億ユーロの評価額で5億ユーロの調達交渉中である。

このコンセンサスとしての具現化された知能への移行は、単なる言葉の予測を超えて、現実世界との相互作用が可能なAIシステムに対する需要の高まりを浮き彫りにしている。専門家の中には、今後3年から5年でワールドモデルがAIアーキテクチャの主流になると予測する者もおり、テキストのみでは物理世界を理解するシステム構築には至らないという見解が強まっている。この動向は、AI研究が、言語的流暢さから、物理的実体との協調へと、その核心的な目標を再定義していることを示唆している。

72 ビュー

ソース元

Marketplace
The Guardian
Nasdaq
Observer
Observer

このトピックに関するさらに多くのニュースを読む:

30 1月

「ムーブメントスナック」：短時間活動が心身にもたらす持続可能な恩恵

15 1月

機能不全な夫婦関係を維持する無意識の二次利得の力学

15 1月

ライフスタイルの整合性を追求：コンテンツクリエイター、ブルック・ロビンスが語る厳格な恋愛基準

エラーや不正確な情報を見つけましたか？できるだけ早くコメントを考慮します。