2026年5月29日にarXivに投稿されたプレプリント「ExpGraph」は、大規模言語モデルに基づくエージェントが、実行モデルのパラメータを変更せずに再利用可能な経験を蓄積できることを主張しています。実行モデルは凍結され、交換可能なままです。この論文は、より強力なモデルに投資するか、あるいは実行エージェント間を移動するポータブルな外部メモリ層に投資するかというAI予算の問題を提起します。このフレームワークは、イリノイ大学アーバナシャンペーン校、南洋理工大学、Meta Monetization AIに所属する11人の研究者によって署名されています。この論文は自然言語処理(cs.CL、arXiv)に分類されており、公開時点ではピアレビューを受けていません。結果は著者によって宣言されています。
ExpGraphのメカニズム: グラフ拡散とRLコパイロット
ExpGraphは、エージェントの履歴を再利用可能なスキルと失敗の教訓として要約し、自己進化型の経験グラフのノードとして組織化します。回収はグラフ拡散とユーティリティによるランク付けを組み合わせ、強化学習(RL)で訓練された軽量コパイロットが、回収した経験を注入する際の報酬信号として、実行時のパフォーマンス差を基に選択します。グラフ拡散コンポーネントの技術的信頼性のシグナルとして、GraphSAGEやOpen Graph Benchmarkで知られるグラフニューラルネットワークの専門家であるJiaxuan Youの存在があります。経験的には、著者はプレプリントで、実行者のサイズに応じて静的タスクで12.2%と4.7%の向上、ALFWorldを含むエージェント環境で21.4%と12.7%の向上を報告しています(他の環境の詳細は要約からはアクセスできません)。評価は、著者自身が設計したベンチマークであるExpSuiteに基づいており、要約には比較基準が記載されていません。これらの結果はまだピアレビューを受けていませんので、一般化する前に注意が必要です。
独自ベンチマーク、名前のないベースライン
ExpGraphによって主張されるパフォーマンスの向上は、著者が設計した評価プロトコルであるExpSuiteで測定されました。比較基準はプレプリントには記載されていません。これらの結果はまだピアレビューを受けていないため、一般化の前に慎重に扱う必要があります。
活発な学術系譜とピアレビューを経た過去の研究
ExpGraphは、すでにいくつかがピアレビューを経ているLLMエージェントの経験学習に関する研究の系譜に位置しています。ICLR 2026で受理された二つの論文は特に比較可能です。MeylanにあるNAVER LABS Europeは、一般的なエージェントにとって未知のタスクへの頑強な一般化が依然として大きな課題であるとし、Retrieval-Augmented LLM Agents: Learning to Learn from Experienceを発表しています。同じ会議でFrom Experience to Strategyも受理され、エージェントに焦点を当てた多層グラフメモリフレームワークと報酬に基づいた重み最適化を提案しています。フラットな経験リストからグラフ構造への移行は初めてではなく、すでに学術レビューを経て実証されています。ExpGraphは新しい変種としてこの空間に加わりますが、現時点では外部の検証を受けていない唯一のものです。
エージェントメモリに関する同時代の三つの論文
| 論文 | 機関 | ステータス | メモリアプローチ |
|---|---|---|---|
| Retrieval-Augmented LLM Agents | NAVER LABS Europe | ICLR 2026 - ピアレビュー済み | 経験強化RAG |
| From Experience to Strategy | 機関名不明 | ICLR 2026 - ピアレビュー済み | 訓練可能なグラフメモリ (RL) |
| ExpGraph | UIUC + NTU + Meta Monetization AI | arXiv プレプリント - ピアレビュー未済 | 構造化経験グラフ |
外部メモリかより強力なモデルか: 異なる提案
UIUC、NTU、Meta Monetization AIによるExpGraphの提案には、著者によって主張される設計上の命題が含まれています。収集された経験に基づくファインチューニングは再利用性を向上させますが、より強力または適切な実行エージェントが出現すると柔軟性を失います。プレプリントで主張される結論は、蓄積された知識はモデル外で生き続けなければならず、モデルが変わる時にポータブルであるべきだということです。Anthropicの進化は、モデルを強化してエージェントの利得をそれと共に移行させるという逆の賭けを示しています。Claudeエージェントが最適化され、2026年5月28日に発表されたClaude Opus 4.8に至りますが、これらの利得はモデルの置き換えに耐えられません。また、自己改善アーキテクチャに中心を移す第三の変種もありますが、これは産業界の研究室でまだ探索段階です。今日のところ、公開された実証研究はこの論争を解決しておらず、三つのアプローチが共存しています。建築的なシフトの未解決の問題は、現時点では競合する論文の主張であり、独立したベンチマーク試験の結果ではありません。
異なる原則に基づく既存の生産スタック
学術の流れとは別に、エージェントのためのメモリの生産エコシステムは2025年にすでに確立されています。Y Combinator、Peak XV、Basis Setから2400万ドルを調達したMem0は、GitHubで41,000以上の星を獲得し、Pythonパッケージは1300万以上のダウンロードを達成したと主張しています。これらのスタックは、ExpGraphと同様に、未変更のモデルの外部メモリ哲学を共有していますが、グラフ拡散と強化学習で駆動される自己進化型グラフには依存していません。これは無視できない違いです。生産スタックは、セッション間の移植性と持続性を追求し、学術スタックは未知のタスクへの一般化を目指します。2026年末までに観察可能なシグナルは、ExpSuite以外でのExpGraphの利得再現性とMem0のAPIコールの軌跡であり、これは生産スタックが自己進化型グラフプリミティブを統合したかどうかを示します。
35百万→186百万APIコールを三四半期で達成
2025年の最初の9ヶ月間におけるMem0の進展は、最適なアーキテクチャに関する学術的な議論とは別に、外部メモリ層に対する産業界の実際の需要を示しています。
