谷歌云AI研究院联合伊利诺伊大学香槟分校及耶鲁大学推出了名为ReasoningBank的记忆框架。该框架旨在解决当前AI智能体存在的“健忘症”问题,使其能够从成功与失败的轨迹中提取可泛化的推理策略,而非仅仅记录原始操作日志或仅从成功案例中学习。
ReasoningBank采用闭环记忆流程,包含记忆检索、提取和整合三个阶段。它将经验压缩为结构化的记忆项,并利用LLM作为评判者判断任务成败,从而将失败转化为预防性策略。此外,研究团队还提出了记忆感知测试时扩展技术(MaTTS),通过生成多条轨迹提供对比信号,形成“更好的记忆引导更好的探索,更丰富的探索锻造更强的记忆”的正向循环。
在WebArena、Mind2Web和SWE-Bench-Verified三个基准测试中,ReasoningBank均优于现有基线。数据显示,在WebArena测试中,结合MaTTS与Gemini-2.5-Pro模型,智能体的整体成功率从无记忆基线的46.7%提升至56.3%,同时减少了平均交互步数。研究发现,该框架的记忆项会随着经验积累自发演化,从简单的检查清单逐渐发展为复杂的组合策略,且无需更新模型权重。