腾讯混元联合人大开源PlanningBench：面向LLM规划能力的评估与训练框架

OmniTools 6月5日消息，腾讯混元（Tencent Hunyuan）与中国人民大学高瓴人工智能学院联合宣布，正式开源PlanningBench。该框架是一个面向大语言模型（LLM）规划能力的可扩展、可验证评估与训练基准。

PlanningBench涵盖30余个真实世界规划任务，支持自动验证与端到端训练，旨在推动大模型从“语言生成”向“实际规划与执行”的能力演进。目前，相关论文、代码及模型权重已同步发布于arXiv、GitHub及HuggingFace平台。