OmniTools 6月5日消息,腾讯混元(Tencent Hunyuan)与中国人民大学高瓴人工智能学院联合宣布,正式开源PlanningBench。该框架是一个面向大语言模型(LLM)规划能力的可扩展、可验证评估与训练基准。
PlanningBench涵盖30余个真实世界规划任务,支持自动验证与端到端训练,旨在推动大模型从“语言生成”向“实际规划与执行”的能力演进。目前,相关论文、代码及模型权重已同步发布于arXiv、GitHub及HuggingFace平台。
OmniTools 6月5日消息,腾讯混元(Tencent Hunyuan)与中国人民大学高瓴人工智能学院联合宣布,正式开源PlanningBench。该框架是一个面向大语言模型(LLM)规划能力的可扩展、可验证评估与训练基准。
PlanningBench涵盖30余个真实世界规划任务,支持自动验证与端到端训练,旨在推动大模型从“语言生成”向“实际规划与执行”的能力演进。目前,相关论文、代码及模型权重已同步发布于arXiv、GitHub及HuggingFace平台。