Preprintul ExpGraph propune o memorie grafică auto-evolutivă pentru agenții LLM

Un preprint depus pe arXiv pe 29 mai 2026, intitulat ExpGraph, susține că un agent bazat pe un model mare de limbaj poate acumula experiență reutilizabilă fără ca vreun parametru al modelului executor să fie modificat - acesta rămâne înghețat și interschimbabil. Teza mută întrebarea bugetului IA: să investești într-un model mai puternic sau într-un strat de memorie extern portabil care călătorește de la un executor la altul? Cadrul este semnat de unsprezece cercetători afiliați la Universitatea din Illinois din Urbana-Champaign, la Nanyang Technological University și la Meta Monetization AI. Lucrarea, clasificată în prelucrarea automată a limbajului (cs.CL pe arXiv), nu a fost supusă recenziei colegiale la data publicării online; rezultatele sunt declarate de autorii săi.

Difuzarea graficului și copilotul RL: mecanismul ExpGraph

ExpGraph rezumă traiectoriile istorice ale unui agent în competențe reutilizabile și lecții de eșec, pe care le organizează ca noduri într-un grafic de experiență auto-evolutiv. Recuperarea combină o difuzare a graficului și o clasificare după utilitate; un copilot ușor antrenat prin învățare prin întărire (RL) selectează experiențele de injectat, având ca semnal de recompensă diferența de performanță a executorului cu și fără experiența recuperată. Prezența printre autori a lui Jiaxuan You, specialist recunoscut în rețele neuronale pe grafice (GraphSAGE, Open Graph Benchmark), este un semnal de credibilitate tehnică pentru componenta de difuzare grafică a cadrului. Pe plan empiric, autorii declară în preprint câștiguri de 12,2% și 4,7% pe sarcini statice în funcție de dimensiunea executorului, și de 21,4% și 12,7% în medii agentice incluzând ALFWorld, un mediu de simulare a gospodăriei devenit standard de evaluare pentru agenți (detaliile celorlalte medii nu sunt accesibile din abstract). Evaluarea se bazează totuși pe ExpSuite, un benchmark conceput de autorii înșiși, iar baseline-ul ales nu este numit în abstract - două piese pe care doar lectura lucrării complete le va clarifica.

Benchmark propriu, baseline nenumit

Câștigurile de performanță revendicate de ExpGraph sunt măsurate pe ExpSuite, un protocol de evaluare conceput de autorii lucrării. Baseline-ul de comparație nu este numit în preprint. Aceste rezultate nu au fost încă supuse unei revizuiri colegiale - de manevrat cu prudență înainte de orice generalizare.

O linie academică activă, și deja trecută prin recenzia colegială

ExpGraph se înscrie într-o linie de lucrări asupra învățării experiențiale a agenților LLM, dintre care câteva au deja trecut pragul recenziei colegiale. Două lucrări acceptate la ICLR 2026 - una din cele trei mari conferințe internaționale de învățare automată - sunt deosebit de comparabile. NAVER LABS Europe, la Meylan, a publicat acolo Retrieval-Augmented LLM Agents: Learning to Learn from Experience, care afirmă că „atingerea unei generalizări robuste la sarcini necunoscute rămâne o provocare majoră” (traducere liberă) pentru agenții generaliști. Aceeași conferință a acceptat From Experience to Strategy, care propune „un cadru de memorie grafică multi-strat, antrenabil, centrat pe agent” (traducere liberă) cuplat cu o optimizare a greutăților ghidată de recompensă. Trecerea de la lista plată de experiențe - paradigmă istoric asociată cu cadrele anterioare, inclusiv ExpeL (AAAI 2024) - spre o structură grafică nu este, așadar, inedită; a fost deja instrumentată și validată prin recenzii academice. Spațiul nu este virgin: ExpGraph se adaugă ca variantă, nu ca ruptură, și rămâne pentru moment singurul dintre cele trei care nu a primit validare externă.

Trei lucrări contemporane despre memoria agenților

Lucrare	Instituție	Statut	Abordare memorie
Retrieval-Augmented LLM Agents	NAVER LABS Europe	ICLR 2026 - peer-reviewed	RAG experiențial
From Experience to Strategy	Non precizată	ICLR 2026 - peer-reviewed	Graphe memorie antrenabilă (RL)
ExpGraph	UIUC + NTU + Meta Monetization AI	arXiv preprint - non peer-reviewed	Graphe de experiențe structurate

Memorie externă sau model mai capabil: două pariuri care nu spun același lucru

Propoziția ExpGraph, semnată de echipa UIUC, NTU și Meta Monetization AI, conține o teză arhitecturală revendicată de autorii săi: fine-tuning-ul pe experiențe colectate îmbunătățește, desigur, reutilizarea, dar devine inflexibil de îndată ce un executor mai puternic sau mai bine adaptat apare. Consecința, susținută în preprint, este că cunoștințele acumulate trebuie să trăiască în afara modelului pentru a rămâne portabile când modelul se schimbă. Traiectoria lui Anthropic ilustrează pariul opus: să întărești modelul pentru ca câștigurile agenților să călătorească cu el - de la agenții Claude optimizați pentru programare până la Claude Opus 4.8 anunțat pe 28 mai 2026, cu o limită asumată: aceste câștiguri nu supraviețuiesc înlocuirii modelului. O a treia variantă, mai marginală, mută din nou centrul de greutate spre arhitecturi de auto-îmbunătățire a modelelor, încă în stadiu exploratoriu în laboratoarele industriale. Niciun studiu empiric publicat nu tranșează astăzi disputa: cele trei abordări coexistă, iar întrebarea deschisă a deplasării arhitecturale rămâne, pentru moment, un argument al lucrărilor concurente mai degrabă decât un rezultat al unui test independent.

Un stack de producție există deja, dar pe alte principii

Alături de traiectoria academică, ecosistemul de producție al memoriei pentru agenți s-a consolidat deja în 2025. Mem0, care a strâns 24 de milioane de dolari în octombrie de la Y Combinator, Peak XV și Basis Set, revendică, conform rundei sale de finanțare, că a depășit 41.000 de stele GitHub și treisprezece milioane de descărcări ale pachetului său Python, și figurează alături de Letta și Supermemory printre cadrele adoptate de dezvoltatori. Aceste stack-uri, ale căror API-uri au trecut de la aproximativ 35 la 186 de milioane de apeluri în primele trei trimestre din 2025 conform cifrelor prezentate de Mem0, împărtășesc cu ExpGraph filosofia unei memorii externe pentru modele nemodificate, dar nu se bazează pe un grafic auto-evolutiv pilotat de difuzare și învățare prin întărire. Distincția nu este neglijabilă: stack-ul de producție caută astăzi portabilitatea și persistența între sesiuni; stack-ul academic vizează generalizarea la sarcini necunoscute. Semnalul observabil până la sfârșitul lui 2026: reproductibilitatea câștigurilor ExpGraph în afara ExpSuite, pe un benchmark agentic terț, și traiectoria apelurilor API ale Mem0 - care va spune dacă stack-ul de producție a integrat, sau nu, primitiva grafică auto-evolutivă.

35 milioane → 186 milioane apeluri API în trei trimestre

Progresul Mem0 în primele nouă luni ale anului 2025 ilustrează cererea industrială reală pentru straturile de memorie externe, indiferent de dezbaterile academice asupra arhitecturii optime.

Stephane Nachez

Redacția ActuIA — știri, date și analize despre inteligența artificială pentru decidenți.