科学出版物

ExpGraph预印本提出自我演化图形记忆用于LLM代理

ExpGraph预印本提出LLM代理的自我演化图形记忆,探讨在不修改模型参数的情况下积累经验,强调外部记忆与更强模型的不同赌注。

STStephane Nachez · · ·1 min
ExpGraph预印本提出自我演化图形记忆用于LLM代理
Sommaire

一份名为ExpGraph的预印本于2026年5月29日发布在arXiv上,主张一种基于大型语言模型的代理可以积累可重复使用的经验,而无需修改执行模型的任何参数——该模型保持冻结和可互换。该论点将问题转向AI预算:是投资于更强大的模型,还是投资于一个可携带的外置记忆层,可以从一个执行器转移到另一个?这一框架由与伊利诺伊大学厄巴纳-香槟分校、南洋理工大学和Meta Monetization AI相关的十一位研究人员签署。此论文分类为自然语言处理(cs.CL在arXiv上),在上线时尚未经过同行评审;其结果由作者声明。

图传播和RL副驾:ExpGraph的机制

ExpGraph将代理的历史轨迹总结为可重复利用的技能和失败经验,并将其组织为自我演化的经验图中的节点。恢复过程结合了图传播和效用排序;一个由强化学习(RL)训练的轻量副驾选择要注入的经验,奖励信号为执行器有无恢复经验的性能差距。作者中包括图神经网络专家Jiaxuan You(GraphSAGE, Open Graph Benchmark),为框架的图传播部分提供了技术可信度。在经验层面,作者在预印本中宣称在静态任务上根据执行器的大小取得了12.2%和4.7%的提升,在包括ALFWorld的代理环境中取得了21.4%和12.7%的提升,ALFWorld是一个已成为代理评估标准的家庭模拟环境(其它环境的详细信息在摘要中不可访问)。然而,评估基于ExpSuite,这是作者自己设计的一个基准测试协议,摘要中未提及比较基准——只有在完整阅读论文后才能了解。

自家基准,未命名比较基准

ExpGraph声称的性能提升是在ExpSuite上测量的,这是由论文作者设计的一个评估协议。预印本中未提及比较基准。这些结果尚未经过同行评审——在进行任何推广之前需谨慎对待。

活跃的学术血脉,已经经过同行评审

ExpGraph属于LLM代理经验学习的研究系列,其中一些已经通过同行评审。两个被ICLR 2026接收的论文——这是机器学习三大国际会议之一——特别具有可比性。NAVER LABS Europe在Meylan发表了Retrieval-Augmented LLM Agents: Learning to Learn from Experience,其认为“对于通用代理来说,实现对未知任务的强泛化仍是一个主要挑战”(自由翻译)。同一会议还接受了From Experience to Strategy,其提出了“一个基于奖励引导的可训练多层图形记忆框架”(自由翻译),并配有权重优化。平列表达经验的过渡——这一历史上与先前框架相关的范式,包括ExpeL(AAAI 2024)——向图形结构的转变因此不是新的;它已经通过学术审阅得到了运用和验证。该领域并不是空白:ExpGraph作为变体加入其中,而不是突破,并且目前是三者中唯一没有得到外部验证的。

三篇关于代理记忆的当代论文

论文机构状态记忆方法
Retrieval-Augmented LLM AgentsNAVER LABS EuropeICLR 2026 - 已经同行评审经验丰富的RAG
From Experience to Strategy未指定ICLR 2026 - 已经同行评审可训练图形记忆(RL)
ExpGraphUIUC + NTU + Meta Monetization AIarXiv预印本 - 未经过同行评审结构化经验图

外部记忆或更强大的模型:两个不同的赌注

由UIUC、NTU和Meta Monetization AI团队签署的ExpGraph提案包含其作者主张的架构性论点:在收集到的经验上进行微调确实提高了重用性,但一旦出现更强大或更合适的执行器,就会变得不灵活。预印本中捍卫的结果是累积的知识必须存在于模型之外,以便在模型更改时保持可移植性。Anthropic的路径展示了相反的赌注:增强模型,以便代理收益随其一同迁移——从为编程优化的Claude代理到在2026年5月28日宣布的Claude Opus 4.8,具有一个公认的限制:这些收益无法在模型更换后存活。第三种更边缘的变体则进一步将重心转移到模型的自我改进架构上,目前仍处于工业实验室的探索阶段。到目前为止,没有发布的实证工作解决这一争议:三种方法共存,而建筑转移的开放性问题仍然是竞争论文的论点,而不是独立的基准结果。

已经存在的生产栈,但基于不同的原则

除了学术路径,代理记忆的生产生态系统在2025年已经巩固。Mem0在10月获得了由Y Combinator、Peak XV和Basis Set的2400万美元融资,根据其筹资轮次声称其GitHub星数已超过41,000,Python包下载量突破1300万次,并与Letta和Supermemory一起被开发者所采用。根据Mem0提出的数据显示,其API调用量从2025年前三个季度的约3500万增加到1.86亿,这与ExpGraph共享了外部记忆不更改模型的理念,但并没有依赖于通过传播和强化学习引导的自我演化图。这个区别不容忽视:生产栈如今寻求的是在会话间的可移植性和持久性;而学术栈则旨在推广到未知任务。到2026年底可观察的信号:ExpGraph在ExpSuite之外的第三方代理基准上获得的可重复性,以及Mem0 API调用的路径——这将说明生产栈是否已整合了自我演化图的原始技术。

三季度内API调用从3500万增长到1.86亿

Mem0在2025年前九个月的进展说明了工业对外部记忆层的真实需求,独立于关于最佳架构的学术辩论。

ST
Stephane Nachez
subscriber

Rédaction ActuIA — actualités, données et analyses sur l'intelligence artificielle pour les décideurs.