Наукова публікація

Препринт ExpGraph пропонує саморозвиваючу графову пам'ять для агентів LLM

Препринт ExpGraph пропонує агентам LLM саморозвиваючу графову пам'ять, що дозволяє накопичувати досвід без зміни параметрів моделі. Цей підхід, на відміну від традиційного, фокусується на зовнішній, переносній пам'яті.

STStephane Nachez · · ·5 min
Препринт ExpGraph пропонує саморозвиваючу графову пам'ять для агентів LLM
Sommaire

Препринт, розміщений на arXiv 29 травня 2026 року, під назвою ExpGraph, стверджує, що агент на основі великої мовної моделі може накопичувати досвід, що підлягає повторному використанню, без зміни жодного параметру виконавчої моделі - вона залишається замороженою та взаємозамінною. Теза змінює питання бюджету ШІ: інвестувати в потужнішу модель чи в портативний зовнішній шар пам'яті, який подорожує від одного виконавця до іншого? Рамка підписана одинадцятьма дослідниками, які працюють в університеті Іллінойсу в Урбана-Шампейн, у Наньянському технологічному університеті та в Meta Monetization AI. Документ, класифікований як автоматична обробка мови (cs.CL на arXiv), не був підданий експертній перевірці на момент його розміщення; результати заявлені авторами.

Розповсюдження графу та копілот RL: механізм ExpGraph

ExpGraph резюмує історичні траєкторії агента у повторно використовувані навички та уроки невдач, які організує як вузли в саморозвиваючомуся графі досвіду. Відновлення даних поєднує розповсюдження графу та ранжування за корисністю; легкий копілот, навчений методом підкріплення (RL), обирає досвіди для впровадження, з сигналом нагороди, що є різницею у продуктивності виконавця з і без відновленого досвіду. Присутність серед авторів Jiaxuan You, визнаного спеціаліста з нейронних мереж на графах (GraphSAGE, Open Graph Benchmark), є технічним сигналом надійності для компоненти розповсюдження графу. На емпіричному рівні автори заявляють у препринті приріст на 12,2% та 4,7% на статичних завданнях залежно від розміру виконавця, і на 21,4% та 12,7% у агентних середовищах, включаючи ALFWorld, домашнє симуляційне середовище, що стало стандартом оцінки для агентів (деталі інших середовищ не доступні з анотації). Оцінка, однак, базується на ExpSuite, бенчмарку, розробленому самими авторами, а базова лінія не вказана в анотації - обидві частини, які тільки повний текст документа дозволить зрозуміти.

Домашній бенчмарк, базова лінія не вказана

Заявлені прирости продуктивності ExpGraph вимірюються на ExpSuite, протоколі оцінки, розробленому авторами документа. Базова лінія порівняння не вказана в препринті. Ці результати ще не пройшли експертну перевірку - слід бути обережними перед будь-якою узагальненням.

Активна академічна лінія, вже пройшла експертну перевірку

ExpGraph вписується в лінію робіт над переживанням досвіду агентами LLM, більшість з яких вже пройшла стадію експертної перевірки. Два документи, прийняті на ICLR 2026 - одну з трьох великих міжнародних конференцій з машинного навчання - є особливо порівняльними. NAVER LABS Europe, у Мейлані, опублікував там Retrieval-Augmented LLM Agents: Learning to Learn from Experience, що стверджує, що "досягнення надійної генералізації на невідомі завдання залишається основним викликом" (вільний переклад) для загальних агентів. Та ж конференція прийняла From Experience to Strategy, що пропонує "багатошарову графову пам'ять, що підлягає навчанню, зосереджену на агенті" (вільний переклад), поєднану з оптимізацією ваг, керованою нагородою. Перехід від плоского списку досвідів - парадигми, історично пов'язаної з попередніми рамками, включаючи ExpeL (AAAI 2024) - до графової структури не є новим; він вже був інструментований і затверджений академічними рецензіями. Простір не є порожнім: ExpGraph додається як варіант, а не як розрив, і поки залишається єдиним з трьох, що не отримав зовнішньої валідації.

Три сучасні документи про агентичну пам'ять

Документ Інституція Статус Підхід до пам'яті
Retrieval-Augmented LLM Agents NAVER LABS Europe ICLR 2026 - peer-reviewed RAG досвідчений
From Experience to Strategy Не вказано ICLR 2026 - peer-reviewed Графова пам'ять, що підлягає навчанню (RL)
ExpGraph UIUC + NTU + Meta Monetization AI arXiv препринт - не peer-reviewed Граф структурованих досвідів

Зовнішня пам'ять чи більш здатна модель: дві ставки, які не означають те саме

Пропозиція ExpGraph, підписана командою UIUC, NTU та Meta Monetization AI, містить архітектурну тезу, заявлену її авторами: тонке налаштування на зібраному досвіді покращує повторне використання, але стає негнучким, коли з'являється більш потужний або краще адаптований виконавець. Наслідок, заявлений у препринті, полягає в тому, що накопичене знання має жити поза моделлю, щоб залишатися портативним, коли модель змінюється. Траєкторія Anthropic ілюструє протилежну ставку: зміцнити модель, щоб агентські прирости подорожували з нею - від оптимізованих агентів Claude для програмування до Claude Opus 4.8, оголошеного 28 травня 2026 року, з прийнятою межею: ці прирости не виживають після заміни моделі. Третій варіант, більш маргінальний, ще більше зміщує центр ваги до архітектур самовдосконалення моделей, які ще перебувають на стадії дослідження в індустріальних лабораторіях. Жодна з опублікованих емпіричних робіт сьогодні не вирішує суперечку: три підходи співіснують, і відкрите питання архітектурного зсуву залишається на даний момент аргументом конкуруючих документів, а не результатом незалежного тестування.

Інша виробнича стека вже існує, але на інших принципах

Поряд з академічною траєкторією, виробниче екосистема пам'яті для агентів вже консолідувалася у 2025 році. Mem0, яке зібрало 24 мільйони доларів у жовтні від Y Combinator, Peak XV та Basis Set, стверджує, що згідно з його інвесторами перевищило 41 000 зірок GitHub та тринадцять мільйонів завантажень свого пакету Python, і розміщене поряд з Letta та Supermemory серед фреймворків, прийнятих розробниками. Ці стеки, чия API змінилася з приблизно 35 до 186 мільйонів викликів за перші три квартали 2025 року за даними, представленими Mem0, поділяють з ExpGraph філософію зовнішньої пам'яті для незмінних моделей, але не базуються на саморозвиваючомуся графі, керованому розповсюдженням та навчанням підкріплення. Відмінність не є незначною: виробнича стека сьогодні шукає портативність та стійкість між сесіями; академічна стека прагне до генералізації на невідомі завдання. Спостережуваний сигнал до кінця 2026 року: відтворюваність приростів ExpGraph поза ExpSuite, на сторонньому агентному бенчмарку, та траєкторія викликів API Mem0 - яка покаже, чи інтегрувала виробнича стека, чи ні, примітив саморозвиваючогося графу.

35 мільйонів → 186 мільйонів викликів API за три квартали

Прогрес Mem0 за перші дев'ять місяців 2025 року ілюструє реальний промисловий попит на зовнішні шари пам'яті, незалежно від академічних дебатів про оптимальну архітектуру.

ST
Stephane Nachez
subscriber

Rédaction ActuIA — actualités, données et analyses sur l'intelligence artificielle pour les décideurs.