dunno why people say that the starting of witcher 3 is boring cause the whole bloody baron sub plot is so brilliantly written. One of my favourite parts of the game
内存操作系统问世:超越RAG局限,解决人工智能的“失忆”难题
编辑者: Olha 12 Yo
当前人工智能系统在迈向高级自主性方面,面临一个根本性的瓶颈,即“无状态性”。大型语言模型(LLMs)在不同的操作会话之间存在着短暂的记忆丢失现象。这一内在缺陷迫切需要一个稳健的架构方案,以实现持久的记忆回溯能力,这对构建复杂的AI代理至关重要。检索增强生成(RAG)技术曾被视为一种权宜之计,用于访问外部知识库。然而,到了2025年下半年,业界普遍认为RAG已无法满足那些对持续、集成记忆有高要求的AI代理需求。
这一关键性的挑战在2025年中期得到了系统性的解决,标志性事件是“MemOS:人工智能系统的内存操作系统”的正式发布。MemOS的研发团队汇集了来自上海交通大学和浙江大学等知名学术机构的研究人员,这些学府在通用人工智能研究领域享有盛誉。MemOS从根本上重新定义了“内存”的概念,将其视为一种核心的、可管理的系统资源,这与传统操作系统分配和调控CPU周期或存储空间的方式如出一辙。这一范式转变意味着内存管理不再是临时的、随意的过程,而是结构化、一等公民的运行组成部分。
MemOS的架构通过引入一个核心抽象概念——“MemCube”(内存立方体),实现了内存类型的统一。MemCube旨在将不同性质的内存,包括易于访问的纯文本记忆和计算开销较大的激活态记忆,整合到一个严格受控的框架之下。每个MemCube都充当一个标准化的容器,它将实际的记忆负载与关键的元数据捆绑在一起,例如记忆的来源、版本历史和既定的治理规则。这使得原始数据得以转化为可操作的系统资产。这种结构促进了动态的内存流动,例如,系统可以自动将频繁访问的纯文本编译成更快的激活态内存,或者通过LoRA适配等方法将稳定的知识固化为参数化内存。
MemOS在架构上的关键特性使其有潜力取代RAG范式,其中最突出的是其生命周期控制与治理机制,用于对活动内存进行基于时间的管理。此外,该系统还具备“可塑性与可演化性”,允许记忆单元进行融合和重构,从而支持持续学习,而无需承担完全模型再训练带来的巨大成本。一个显著的实际优势是其跨平台可移植性,它使得孤立的记忆“孤岛”能够在不同的软件工具之间无缝迁移,有效打破了当前AI部署中普遍存在的“数据孤岛”现象。
针对既有的内存解决方案进行的实证测试表明,当内存被视为主要的计算资源时,性能得到了显著提升。具体而言,在与OpenAI的专有记忆系统进行基准测试时,MemOS在时间推理任务上的表现提升了159%。在专门用于测试多会话对话(平均19次会话)中长期记忆的严苛LOCOMO基准测试中,MemOS实现了38.9%的总体性能提升,其中一项报告指出准确率提升达到了38.97%。通过高效地注入键值(KV)缓存,该系统显著降低了运行开销,延迟减少高达94%。MemOS的问世,标志着业界正果断转向构建具备持久、演进认知结构的AI系统,彻底告别了RAG架构中固有的临时性上下文检索限制。
来源
Medium
arXiv
VentureBeat
Medium
Hugging Face
MarkTechPost



