Препринт ExpGraph пропонує саморозвиваючу графову пам'ять для агентів LLM

Препринт, розміщений на arXiv 29 травня 2026 року, під назвою ExpGraph, стверджує, що агент на основі великої мовної моделі може накопичувати досвід, що підлягає повторному використанню, без зміни жодного параметру виконавчої моделі - вона залишається замороженою та взаємозамінною. Теза змінює питання бюджету ШІ: інвестувати в потужнішу модель чи в портативний зовнішній шар пам'яті, який подорожує від одного виконавця до іншого? Рамка підписана одинадцятьма дослідниками, які працюють в університеті Іллінойсу в Урбана-Шампейн, у Наньянському технологічному університеті та в Meta Monetization AI. Документ, класифікований як автоматична обробка мови (cs.CL на arXiv), не був підданий експертній перевірці на момент його розміщення; результати заявлені авторами.

Розповсюдження графу та копілот RL: механізм ExpGraph

ExpGraph резюмує історичні траєкторії агента у повторно використовувані навички та уроки невдач, які організує як вузли в саморозвиваючомуся графі досвіду. Відновлення даних поєднує розповсюдження графу та ранжування за корисністю; легкий копілот, навчений методом підкріплення (RL), обирає досвіди для впровадження, з сигналом нагороди, що є різницею у продуктивності виконавця з і без відновленого досвіду. Присутність серед авторів Jiaxuan You, визнаного спеціаліста з нейронних мереж на графах (GraphSAGE, Open Graph Benchmark), є технічним сигналом надійності для компоненти розповсюдження графу. На емпіричному рівні автори заявляють у препринті приріст на 12,2% та 4,7% на статичних завданнях залежно від розміру виконавця, і на 21,4% та 12,7% у агентних середовищах, включаючи ALFWorld, домашнє симуляційне середовище, що стало стандартом оцінки для агентів (деталі інших середовищ не доступні з анотації). Оцінка, однак, базується на ExpSuite, бенчмарку, розробленому самими авторами, а базова лінія не вказана в анотації - обидві частини, які тільки повний текст документа дозволить зрозуміти.

Домашній бенчмарк, базова лінія не вказана

Заявлені прирости продуктивності ExpGraph вимірюються на ExpSuite, протоколі оцінки, розробленому авторами документа. Базова лінія порівняння не вказана в препринті. Ці результати ще не пройшли експертну перевірку - слід бути обережними перед будь-якою узагальненням.

Активна академічна лінія, вже пройшла експертну перевірку

ExpGraph вписується в лінію робіт над переживанням досвіду агентами LLM, більшість з яких вже пройшла стадію експертної перевірки. Два документи, прийняті на ICLR 2026 - одну з трьох великих міжнародних конференцій з машинного навчання - є особливо порівняльними. NAVER LABS Europe, у Мейлані, опублікував там Retrieval-Augmented LLM Agents: Learning to Learn from Experience, що стверджує, що "досягнення надійної генералізації на невідомі завдання залишається основним викликом" (вільний переклад) для загальних агентів. Та ж конференція прийняла From Experience to Strategy, що пропонує "багатошарову графову пам'ять, що підлягає навчанню, зосереджену на агенті" (вільний переклад), поєднану з оптимізацією ваг, керованою нагородою. Перехід від плоского списку досвідів - парадигми, історично пов'язаної з попередніми рамками, включаючи ExpeL (AAAI 2024) - до графової структури не є новим; він вже був інструментований і затверджений академічними рецензіями. Простір не є порожнім: ExpGraph додається як варіант, а не як розрив, і поки залишається єдиним з трьох, що не отримав зовнішньої валідації.

Три сучасні документи про агентичну пам'ять

Документ	Інституція	Статус	Підхід до пам'яті
Retrieval-Augmented LLM Agents	NAVER LABS Europe	ICLR 2026 - peer-reviewed	RAG досвідчений
From Experience to Strategy	Не вказано	ICLR 2026 - peer-reviewed	Графова пам'ять, що підлягає навчанню (RL)
ExpGraph	UIUC + NTU + Meta Monetization AI	arXiv препринт - не peer-reviewed	Граф структурованих досвідів

Зовнішня пам'ять чи більш здатна модель: дві ставки, які не означають те саме

Пропозиція ExpGraph, підписана командою UIUC, NTU та Meta Monetization AI, містить архітектурну тезу, заявлену її авторами: тонке налаштування на зібраному досвіді покращує повторне використання, але стає негнучким, коли з'являється більш потужний або краще адаптований виконавець. Наслідок, заявлений у препринті, полягає в тому, що накопичене знання має жити поза моделлю, щоб залишатися портативним, коли модель змінюється. Траєкторія Anthropic ілюструє протилежну ставку: зміцнити модель, щоб агентські прирости подорожували з нею - від оптимізованих агентів Claude для програмування до Claude Opus 4.8, оголошеного 28 травня 2026 року, з прийнятою межею: ці прирости не виживають після заміни моделі. Третій варіант, більш маргінальний, ще більше зміщує центр ваги до архітектур самовдосконалення моделей, які ще перебувають на стадії дослідження в індустріальних лабораторіях. Жодна з опублікованих емпіричних робіт сьогодні не вирішує суперечку: три підходи співіснують, і відкрите питання архітектурного зсуву залишається на даний момент аргументом конкуруючих документів, а не результатом незалежного тестування.

Інша виробнича стека вже існує, але на інших принципах

Поряд з академічною траєкторією, виробниче екосистема пам'яті для агентів вже консолідувалася у 2025 році. Mem0, яке зібрало 24 мільйони доларів у жовтні від Y Combinator, Peak XV та Basis Set, стверджує, що згідно з його інвесторами перевищило 41 000 зірок GitHub та тринадцять мільйонів завантажень свого пакету Python, і розміщене поряд з Letta та Supermemory серед фреймворків, прийнятих розробниками. Ці стеки, чия API змінилася з приблизно 35 до 186 мільйонів викликів за перші три квартали 2025 року за даними, представленими Mem0, поділяють з ExpGraph філософію зовнішньої пам'яті для незмінних моделей, але не базуються на саморозвиваючомуся графі, керованому розповсюдженням та навчанням підкріплення. Відмінність не є незначною: виробнича стека сьогодні шукає портативність та стійкість між сесіями; академічна стека прагне до генералізації на невідомі завдання. Спостережуваний сигнал до кінця 2026 року: відтворюваність приростів ExpGraph поза ExpSuite, на сторонньому агентному бенчмарку, та траєкторія викликів API Mem0 - яка покаже, чи інтегрувала виробнича стека, чи ні, примітив саморозвиваючогося графу.

35 мільйонів → 186 мільйонів викликів API за три квартали

Прогрес Mem0 за перші дев'ять місяців 2025 року ілюструє реальний промисловий попит на зовнішні шари пам'яті, незалежно від академічних дебатів про оптимальну архітектуру.

Stephane Nachez

Редакція ActuIA — новини, дані й аналітика про штучний інтелект для керівників.

Препринт ExpGraph пропонує саморозвиваючу графову пам'ять для агентів LLM

Розповсюдження графу та копілот RL: механізм ExpGraph

Активна академічна лінія, вже пройшла експертну перевірку

Зовнішня пам'ять чи більш здатна модель: дві ставки, які не означають те саме

Інша виробнича стека вже існує, але на інших принципах

Допоможений GPT-5, а потім залишений сам на сам: рандомізований експеримент вимірює ціну навчання з AI-асистентом

Machine unlearning: Google Research підтвердила аудит-тест, але поки не для LLMs

GPT більш впевнений у складних завданнях, де вони найчастіше помиляються, згідно з препринтом USC/Berkeley