谷歌云AI等团队推出ReasoningBank记忆框架，让智能体从成败经验中学习

谷歌云AI研究院联合伊利诺伊大学香槟分校及耶鲁大学推出了名为ReasoningBank的记忆框架。该框架旨在解决当前AI智能体存在的“健忘症”问题，使其能够从成功与失败的轨迹中提取可泛化的推理策略，而非仅仅记录原始操作日志或仅从成功案例中学习。

ReasoningBank采用闭环记忆流程，包含记忆检索、提取和整合三个阶段。它将经验压缩为结构化的记忆项，并利用LLM作为评判者判断任务成败，从而将失败转化为预防性策略。此外，研究团队还提出了记忆感知测试时扩展技术（MaTTS），通过生成多条轨迹提供对比信号，形成“更好的记忆引导更好的探索，更丰富的探索锻造更强的记忆”的正向循环。

在WebArena、Mind2Web和SWE-Bench-Verified三个基准测试中，ReasoningBank均优于现有基线。数据显示，在WebArena测试中，结合MaTTS与Gemini-2.5-Pro模型，智能体的整体成功率从无记忆基线的46.7%提升至56.3%，同时减少了平均交互步数。研究发现，该框架的记忆项会随着经验积累自发演化，从简单的检查清单逐渐发展为复杂的组合策略，且无需更新模型权重。