dunno why people say that the starting of witcher 3 is boring cause the whole bloody baron sub plot is so brilliantly written. One of my favourite parts of the game
Memory Operating System Pakt AI-Geheugenverlies Aan Voorbij de Beperkingen van RAG
Bewerkt door: Olha 12 Yo
De grootste hindernis voor het bereiken van geavanceerde autonomie in de huidige kunstmatige intelligentie is het probleem van staatloosheid. Dit manifesteert zich doordat Grote Taalmodellen (LLM's) hun kortetermijngeheugen verliezen tussen verschillende operationele sessies. Deze inherente beperking vereist een robuuste architecturale oplossing om blijvende herinnering mogelijk te maken, wat essentieel is voor complexe AI-agenten. Hoewel Retrieval-Augmented Generation (RAG) diende als een tijdelijke noodgreep om toegang te krijgen tot externe kennisbanken, groeide de consensus in de tweede helft van 2025 dat RAG ontoereikend was voor agenten die een continue, geïntegreerde geheugenfunctie nodig hadden.
Deze cruciale uitdaging werd halverwege 2025 systematisch aangepakt met de officiële introductie van MemOS: een Memory Operating System voor AI-systemen. Het ontwikkelingsteam achter MemOS bestond uit onderzoekers verbonden aan vooraanstaande academische instellingen zoals de Shanghai Jiao Tong Universiteit en de Zhejiang Universiteit, beide bekend om hun diepgaande betrokkenheid bij onderzoek naar Algemene Kunstmatige Intelligentie. MemOS herdefinieert het concept geheugen fundamenteel door het te positioneren als een kern, beheersbare systeembron. Dit is analoog aan hoe traditionele besturingssystemen de toewijzing en het beheer van CPU-cycli of opslagruimte regelen. Deze verschuiving in paradigma transformeert geheugenbeheer van een ad-hoc proces naar een gestructureerd, volwaardig operationeel onderdeel.
De architectuur van MemOS bewerkstelligt deze eenwording door gebruik te maken van een centrale abstractie, de zogenaamde MemCube. Deze MemCube consolideert diverse geheugentypes, variërend van eenvoudig toegankelijke platte tekst tot computationeel veeleisend activatiegebaseerd geheugen, binnen een strikt gecontroleerd raamwerk. Elke MemCube fungeert als een gestandaardiseerde container. Deze bundelt de daadwerkelijke geheugeninhoud met noodzakelijke metadata, zoals de herkomst, de versiegeschiedenis en de vastgestelde governance-regels. Hierdoor wordt ruwe data omgezet in een hanteerbare systeembetrokkenheid. Deze structuur faciliteert een dynamische geheugenstroom, waardoor vaak geraadpleegde platte tekst automatisch kan worden gecompileerd naar sneller activatiegeheugen, of stabiele kennis kan worden verankerd in parametrisch geheugen door middel van technieken zoals LoRA-aanpassing.
Verschillende architecturale kenmerken onderscheiden MemOS als een potentiële opvolger van het RAG-paradigma. Met name de mechanismen voor Levenscyclusbeheer en Governance zorgen voor een actieve, tijdgebaseerde geheugenadministratie. Bovendien integreert het systeem Plasticiteit en Evolvability. Dit stelt geheugeneenheden in staat om te fuseren en te worden geherstructureerd, wat continu leren ondersteunt zonder de hoge kosten van volledige modelhertraining. Een belangrijk praktisch voordeel is de Cross-Platform Portability. Dit maakt de naadloze migratie van geïsoleerde geheugeneilanden mogelijk tussen verschillende softwaretools, waardoor de bestaande datasilo's die de huidige AI-implementaties teisteren, effectief worden doorbroken.
Empirische tests tegen gevestigde geheugenoplossingen toonden aanzienlijke prestatieverbeteringen aan wanneer geheugen werd behandeld als een primaire computationele bron. Concreet liet MemOS een prestatieverbetering van 159% zien bij taken die temporeel redeneren vereisten, vergeleken met het propriëtaire geheugensysteem van OpenAI. Op de strenge LOCOMO-benchmark, ontworpen om langetermijn-gespreksgeheugen te testen over gemiddeld 19 sessies, behaalde MemOS een algemene verbetering van 38,9%. Eén gerapporteerd cijfer wees zelfs op een nauwkeurigheidswinst van 38,97%. Bovendien leidde het tot een substantieel verlaagde operationele overhead dankzij efficiënte Key-Value (KV)-cache-injecties, wat resulteerde in een latentiereductie tot wel 94%. De introductie van MemOS markeert een beslissende verschuiving in de industrie naar het bouwen van AI-systemen die zijn uitgerust met persistente, evoluerende cognitieve structuren, waarmee afstand wordt genomen van de beperkingen van tijdelijke contextophaling die inherent zijn aan RAG-architecturen.
Bronnen
Medium
arXiv
VentureBeat
Medium
Hugging Face
MarkTechPost



