Зсув у ШІ: Від Мовних Моделей до Світових Моделей Втіленого Інтелекту

Відредаговано: firstname lastname

Траєкторія досліджень у сфері Штучного Загального Інтелекту (ШЗІ) у 2025 році демонструє рішучий зсув фокусу від Великих Мовних Моделей (ВММ) до так званих «світових моделей». Цей перехід підкреслює зростаючий попит на системи ШІ, здатні до реальної взаємодії, виходячи за межі простого передбачення тексту. Світові моделі прагнуть надати штучному інтелекту здатність симулювати та оперувати логікою фізичного світу, долаючи ключове обмеження ВММ, які часто не мають розуміння фізики та причинно-наслідкових зв'язків.

Критика ВММ як «глухого кута» для втіленого ШІ лунає від провідних діячів галузі. Когнітивний науковець Гері Маркус послідовно стверджує, що ВММ фундаментально обмежені у надійності та здатності до міркування, виступаючи за нейро-символічні підходи, які явно програмують правила світу. Маркус підкреслює, що для досягнення ШЗІ необхідні гібридні моделі, які поєднують глибоке навчання з класичними символічними операціями, оскільки чисте масштабування нейронних мереж, як-от трансформерів, не дає змоги маніпулювати символами чи розуміти абстрактні принципи.

У цьому контексті значущі кроки роблять дослідницькі групи, зосереджені на просторовому інтелекті. Стенфордська дослідниця Фей-Фей Лі представила «Marble», світову модель, орієнтовану на просторовий інтелект, стверджуючи, що ШЗІ вимагає підвищення сприйняття до рівня дії. Її стартап World Labs, заснований у вересні 2024 року, випустив Marble як комерційну модель, що генерує 3D-сцени з текстових підказок, зображень чи відео, позиціонуючи просторовий інтелект як наступний етап розвитку ШІ.

Конкуренція у сфері світових моделей стимулює інновації у симуляційних технологіях. Google DeepMind продовжує розвивати свою симуляційну роботу з моделлю Genie 3, яка здатна генерувати інтерактивні 3D-середовища в реальному часі зі швидкістю 24 кадри на секунду (fps) та роздільною здатністю 720p, використовуючи лише текстовий запит. Ця модель, випущена 5 серпня 2025 року, розглядається DeepMind як ключовий етап на шляху до ШЗІ, де агенти навчаються через симульований досвід, а не лише реагують на дані. Genie 3 вбудовує пам'ять у симуляцію, що дозволяє агентам міркувати на довших часових горизонтах.

Цей консенсусний зсув до втіленого інтелекту супроводжується змінами у керівництві великих технологічних компаній. Ян ЛеКун, колишній головний науковий співробітник Meta, заснував стартап Advanced Machine Intelligence Labs (AMI Labs), повністю присвячений розробці світових моделей. AMI Labs, що базується в Парижі, Франція, планує запуск на січень 2026 року і веде переговори про залучення 500 мільйонів євро при оцінці в 3 мільярди євро, з метою створення систем, які моделюють фізичний світ для робототехніки та транспорту.

Перехід до світових моделей має глибокі наслідки для промисловості, особливо для секторів, критичних до точності, таких як виробництво та логістика. Компанії, які інвестують у можливості світових моделей, можуть отримати конкурентну перевагу в операційній ефективності, оскільки ці моделі стануть основним шаром прийняття рішень. У сфері робототехніки світові моделі, як-от ті, що вдосконалюються завдяки симуляторам на кшталт Cosmos від NVIDIA, є ключовими для навчання роботів у віртуальних середовищах, які добре переносяться у реальне життя.

72 Перегляди

Джерела

  • Marketplace

  • The Guardian

  • Nasdaq

  • Observer

  • Observer

Знайшли помилку чи неточність?Ми розглянемо ваші коментарі якомога швидше.