Операционная система памяти MemOS решает проблему отсутствия состояния ИИ, превосходя ограничения RAG

Отредактировано: Olha 12 Yo

Ключевым препятствием на пути к созданию по-настоящему продвинутых автономных систем искусственного интеллекта является проблема отсутствия состояния. Это проявляется в том, что большие языковые модели (LLM) теряют временную память при завершении сеансов работы. Данное фундаментальное ограничение требует создания надежного архитектурного решения, способного обеспечить постоянное запоминание информации, что критически важно для сложных агентов ИИ. Метод генерации с дополненным поиском (RAG) служил временным решением для доступа к внешним хранилищам знаний, однако ко второй половине 2025 года стало очевидно, что он не справляется с требованиями агентов, нуждающихся в непрерывной и интегрированной памяти.

Эта насущная проблема была системно решена в середине 2025 года с официальным представлением MemOS: Операционной системы Памяти для систем ИИ. В разработке MemOS участвовали исследователи из таких ведущих академических учреждений, как Шанхайский университет Цзяо Тун и Чжэцзянский университет, известных своим глубоким вкладом в исследования общего искусственного интеллекта. MemOS коренным образом переосмысливает понятие памяти, позиционируя ее как основной, управляемый системный ресурс, подобно тому, как традиционные операционные системы выделяют и контролируют циклы ЦП или дисковое пространство. Этот сдвиг парадигмы переводит управление памятью из разряда спонтанных действий в структурированный, первоклассный операционный компонент.

Архитектура MemOS достигает этой унификации посредством использования центральной абстракции, названной MemCube (Мем-куб). Этот элемент служит для консолидации разнообразных типов памяти, включая легкодоступный простой текст и ресурсоемкую память, основанную на активации, под строгим контролем. Каждый MemCube функционирует как стандартизированный контейнер, объединяющий фактическую полезную нагрузку памяти с необходимой метаинформацией, такой как происхождение, история версий и установленные правила управления. Это превращает сырые данные в управляемый системный актив. Такая структура способствует динамическому потоку памяти, позволяя автоматически компилировать часто используемый текст в более быструю активационную память или закреплять стабильные знания в параметрической памяти посредством таких методов, как адаптация LoRA.

Ключевые архитектурные особенности выделяют MemOS как потенциального преемника парадигмы RAG. В частности, это механизмы Контроля Жизненного Цикла и Управления для активного, основанного на времени администрирования памяти. Более того, система включает Пластичность и Эволюционность, что позволяет объединять и реструктурировать блоки памяти. Это поддерживает непрерывное обучение без непомерных затрат на полное переобучение модели. Значительным практическим преимуществом является Кросс-платформенная Переносимость, которая обеспечивает бесшовную миграцию изолированных «островов памяти» между различными программными инструментами, тем самым устраняя существующие информационные барьеры, характерные для современных развертываний ИИ.

Эмпирическое тестирование по сравнению с устоявшимися решениями для работы с памятью продемонстрировало существенный прирост производительности, когда память рассматривалась как основной вычислительный ресурс. В частности, MemOS показала 159-процентный скачок производительности в задачах темпорального рассуждения при сравнении с проприетарной системой памяти от OpenAI. На строгом бенчмарке LOCOMO, разработанном для проверки долгосрочной диалоговой памяти в многосессионных беседах, в среднем включающих 19 сессий, MemOS достигла общего улучшения на 38,9%. Один из зафиксированных показателей даже указал на 38,97-процентный прирост точности. Кроме того, операционные накладные расходы были существенно снижены за счет эффективных инъекций кэша «ключ-значение» (KV), что привело к сокращению задержки до 94%. Внедрение MemOS знаменует решительный поворот в отрасли в сторону создания систем ИИ, наделенных постоянными, развивающимися когнитивными структурами, что является отходом от ограничений временного извлечения контекста, присущих архитектурам RAG.

12 Просмотров

Источники

  • Medium

  • arXiv

  • VentureBeat

  • Medium

  • Hugging Face

  • MarkTechPost

Вы нашли ошибку или неточность?Мы учтем ваши комментарии как можно скорее.