記憶作業系統應運而生:突破檢索增強生成(RAG)限制,解決AI的無狀態性難題

编辑者: Olha 12 Yo

當前人工智慧系統在邁向更高級別的自主性時,面臨著一個根本性的瓶頸,那就是「無狀態性」。這指的是大型語言模型(LLMs)在不同的操作會話之間,會出現暫時性的記憶丟失。要實現複雜AI代理所需的持續性回憶能力,就必須建立一個強健的架構解決方案來克服這一內在限制。檢索增強生成(RAG)技術曾被視為一種權宜之計,用於存取外部知識庫,然而,到了2025年下半年,業界的共識逐漸傾向於認為,對於需要連續、整合記憶的代理而言,RAG的效能已顯得力不從心。

這個關鍵性的挑戰在2025年中期得到了系統性的解決,標誌著「MemOS:AI系統的記憶作業系統」的正式問世。MemOS的開發團隊匯集了來自上海交通大學和浙江大學等頂尖學術機構的研究人員,這些機構在通用人工智慧(AGI)領域的研究投入甚深。MemOS從根本上重新定義了記憶的概念,將其視為一個核心且可管理的系統資源,這與傳統作業系統分配和調度CPU週期或儲存空間的方式如出一轍。這種範式的轉變,使得記憶管理不再是隨機應變的過程,而是成為一個結構化、具備一等公民地位的操作組成部分。

MemOS的架構透過引入一個名為「MemCube」的核心抽象層,實現了記憶類型的統一。MemCube旨在將不同性質的記憶,包括易於存取的純文字記憶和運算需求較高的激活記憶,整合在一個受到嚴格控制的框架之下。每個MemCube都充當一個標準化的容器,將實際的記憶負載與關鍵的元數據(如來源、版本歷史和既定的治理規則)捆綁在一起,從而將原始數據轉化為可操作的系統資產。這種結構促進了動態的記憶流動,允許經常存取的純文字資料自動編譯成更快速的激活記憶,或是透過如LoRA適配等方法,將穩定的知識轉化為參數記憶。

MemOS在架構上的幾個關鍵特點,使其有潛力取代RAG的地位。其中最引人注目的是其生命週期控制與治理機制,用於主動地、基於時間的記憶管理。此外,該系統內建了「可塑性與可演化性」,使得記憶單元能夠被融合和重構,從而支持持續學習,而無需承擔完整模型重新訓練的巨大成本。一個顯著的實際優勢是其跨平台可攜帶性,這使得隔離的記憶區塊能夠在不同的軟體工具之間無縫遷移,有效打破了當前AI部署中普遍存在的數據孤島問題。

針對既有的記憶解決方案進行的實證測試,清楚地展示了當記憶被視為主要運算資源時,性能獲得了顯著的提升。具體而言,在時間推理任務的基準測試中,MemOS相較於OpenAI的專有記憶系統,展現了高達159%的性能增長。在專門用於測試多會話對話中長期記憶的嚴苛LOCOMO基準測試中(平均對話長度為19個會話),MemOS達成了38.9%的整體性能提升,其中一項報告更指出準確率提高了38.97%。透過高效的鍵值(KV)快取注入,系統的運營開銷也大幅降低,延遲減少高達94%。MemOS的問世,標誌著業界正果斷轉向構建具備持久性、演化性認知結構的AI系統,從根本上擺脫了RAG架構中上下文檢索的暫時性限制。

12 浏览量

來源

  • Medium

  • arXiv

  • VentureBeat

  • Medium

  • Hugging Face

  • MarkTechPost

发现错误或不准确的地方吗?我们会尽快处理您的评论。