De preprint ExpGraph stelt een zelf-evoluerend grafiekgeheugen voor voor LLM-agenten

Een preprint ingediend op arXiv op 29 mei 2026, genaamd ExpGraph, stelt dat een agent gebaseerd op een groot taalmodel herbruikbare ervaring kan opdoen zonder dat er parameters van het uitvoerende model worden gewijzigd - het blijft bevroren en uitwisselbaar. De stelling verschuift de vraag over het AI-budget: investeren in een krachtiger model, of in een draagbare externe geheugenslaag die van de ene uitvoerder naar de andere reist? Het kader is ondertekend door elf onderzoekers verbonden aan de Universiteit van Illinois in Urbana-Champaign, aan de Nanyang Technological University en aan Meta Monetization AI. Het document, geclassificeerd onder automatische taalverwerking (cs.CL op arXiv), is op het moment van online zetten niet onderworpen aan peer review; de resultaten worden door de auteurs verklaard.

Grafiekverspreiding en RL-copiloot: het mechanisme van ExpGraph

ExpGraph vat de historische trajecten van een agent samen in herbruikbare vaardigheden en mislukkingslessen, die het organiseert als knooppunten in een zelf-evoluerende ervaringsgrafiek. Het ophalen combineert een grafiekverspreiding en een rangschikking naar nut; een lichte copiloot getraind door middel van versterkend leren (RL) selecteert de ervaringen om te injecteren, met als beloningssignaal de prestatiedelta van de uitvoerder met en zonder opgehaalde ervaring. De aanwezigheid onder de auteurs van Jiaxuan You, een erkend specialist in grafische neurale netwerken (GraphSAGE, Open Graph Benchmark), is een signaal van technische geloofwaardigheid voor de grafiekverspreidingscomponent van het kader. Empirisch verklaren de auteurs in de preprint winsten van 12,2% en 4,7% op statische taken afhankelijk van de grootte van de uitvoerder, en van 21,4% en 12,7% in agentische omgevingen waaronder ALFWorld, een standaard evaluatiesimulatie voor agenten (de details van andere omgevingen zijn niet toegankelijk vanuit het abstract). De evaluatie is echter gebaseerd op ExpSuite, een benchmark ontworpen door de auteurs zelf, en de gekozen baseline wordt niet genoemd in het abstract - twee stukken die alleen door het volledige document te lezen kunnen worden ingekaderd.

Zelfgemaakte benchmark, niet genoemde baseline

De prestatiewinsten geclaimd door ExpGraph worden gemeten op ExpSuite, een evaluatieprotocol ontworpen door de auteurs van het document. De vergelijking baseline wordt niet genoemd in de preprint. Deze resultaten zijn nog niet door een peer review gegaan - voorzichtig mee omgaan voordat men generaliseert.

Een actieve academische lijn, en al door peer review gegaan

ExpGraph maakt deel uit van een lijn van onderzoek naar ervaringsleren van LLM-agenten, waarvan er al verschillende de peer review zijn gepasseerd. Twee documenten geaccepteerd op ICLR 2026 - een van de drie grote internationale machine learning conferenties - zijn bijzonder vergelijkbaar. NAVER LABS Europe, in Meylan, heeft daar gepubliceerd Retrieval-Augmented LLM Agents: Learning to Learn from Experience, dat stelt dat 'het bereiken van robuuste generalisatie naar onbekende taken een grote uitdaging blijft' (vrije vertaling) voor generalistische agenten. Dezelfde conferentie accepteerde From Experience to Strategy, dat een 'trainbaar, agent-gecentreerd meerlagig grafiekgeheugenkader' (vrije vertaling) biedt gekoppeld aan een beloningsgestuurde optimalisatie van gewichten. De verschuiving van de platte lijst van ervaringen - een paradigma historisch geassocieerd met eerdere kaders, waaronder ExpeL (AAAI 2024) - naar een grafiekstructuur is dus niet nieuw; het is al geïmplementeerd en gevalideerd door academische reviews. De ruimte is niet ongerept: ExpGraph voegt zich eraan toe als een variant, niet als een breuk, en blijft voorlopig de enige van de drie die geen externe validatie heeft ontvangen.

Drie hedendaagse artikelen over agentisch geheugen

Artikel	Instelling	Status	Geheugenbenadering
Retrieval-Augmented LLM Agents	NAVER LABS Europe	ICLR 2026 - peer-reviewed	Ervarings-RAG
From Experience to Strategy	Niet gespecificeerd	ICLR 2026 - peer-reviewed	Trainbaar grafiekgeheugen (RL)
ExpGraph	UIUC + NTU + Meta Monetization AI	arXiv preprint - niet peer-reviewed	Gestructureerde ervaringsgrafiek

Externe geheugen of capabeler model: twee weddenschappen die niet hetzelfde zeggen

Het voorstel van ExpGraph, ondertekend door het team van UIUC, NTU en Meta Monetization AI, bevat een architecturale stelling die door zijn auteurs wordt geclaimd: het fine-tunen op verzamelde ervaringen verbetert zeker de herbruikbaarheid, maar wordt inflexibel zodra een krachtiger of beter aangepast uitvoerder opduikt. De consequentie, verdedigd in de preprint, is dat de geaccumuleerde kennis buiten het model moet leven om draagbaar te blijven wanneer het model verandert. De trajectorie van Anthropic illustreert de tegengestelde weddenschap: het model versterken zodat de agentische winsten met hem meereizen - van Claude-agenten geoptimaliseerd voor programmering tot Claude Opus 4.8 aangekondigd op 28 mei 2026, met een veronderstelde limiet: deze winsten overleven de vervanging van het model niet. Een derde, meer marginale variant verplaatst het zwaartepunt nog verder naar auto-verbeteringsarchitecturen van modellen, nog in de verkennende fase in industriële laboratoria. Geen gepubliceerd empirisch werk neemt vandaag de geschillen weg: de drie benaderingen coëxisteren, en de open vraag van de architecturale verschuiving blijft, voorlopig, een argument in concurrerende documenten meer dan een resultaat van een onafhankelijke testbank.

Een productie-stack bestaat al, maar op andere principes

Naast de academische trajectorie is het productie-ecosysteem voor agentengeheugen al geconsolideerd in 2025. Mem0, dat 24 miljoen dollar heeft opgehaald in oktober bij Y Combinator, Peak XV en Basis Set, claimt volgens zijn financieringsronde meer dan 41.000 GitHub-sterren en dertien miljoen downloads van zijn Python-pakket te hebben overtroffen, en staat naast Letta en Supermemory als de kaders die door ontwikkelaars worden aangenomen. Deze stacks, waarvan de API volgens de cijfers gepresenteerd door Mem0 is gestegen van ongeveer 35 naar 186 miljoen oproepen in de eerste drie kwartalen van 2025, delen met ExpGraph de filosofie van een extern geheugen voor ongemodificeerde modellen, maar zijn niet gebaseerd op een zelf-evoluerende grafiek gestuurd door verspreiding en versterkend leren. Het onderscheid is niet triviaal: de productiestack zoekt vandaag de draagbaarheid en persistentie tussen sessies; de academische stack richt zich op generalisatie naar onbekende taken. Het waarneembare signaal tegen eind 2026: de reproduceerbaarheid van ExpGraph-winsten buiten ExpSuite, op een externe agentische benchmark, en de trajectorie van Mem0's API-oproepen - die zal zeggen of de productie-stack al dan niet de zelf-evoluerende grafiekprimitief heeft geïntegreerd.

35 miljoen → 186 miljoen API-oproepen in drie kwartalen

De voortgang van Mem0 in de eerste negen maanden van 2025 illustreert de werkelijke industriële vraag naar externe geheugenslagen, ongeacht de academische debatten over de optimale architectuur.

Stephane Nachez

Redactie ActuIA — nieuws, data en analyses over kunstmatige intelligentie voor besluitvormers.