返回行业动态

通义实验室发布Qwen-RobotNav:面向智能体导航的可扩展模型

2026/06/16 04:54
查看原文

OmniTools 6月16日消息,通义实验室正式发布Qwen-RobotNav导航模型。该模型基于Qwen3-VL架构,在1560万样本上训练完成,统一支持视觉语言导航、目标导航、目标跟踪、自动驾驶及具身问答五大任务,推理时无需修改模型结构即可灵活切换任务模式与观察参数。

在多项权威基准测试中,Qwen-RobotNav取得当前最优性能:VLN-CE RxR成功率达76.5%,HM3Dv2目标导航准确率75.6%(仅RGB输入),EVT-Bench跟踪率90.0%,NAVSIM PDMS得分91.4,并刷新三项具身问答(EQA)指标。

该模型开放四个可调节维度(视觉Token预算、时间衰减系数、相机权重及帧采样模式)。作为智能体系统的一部分,其配套上层规划器Qwen3.7-Plus在EXPRESS-Bench测试中性能提升15.4%,导航步数大幅减少77%。目前,该模型已实现零样本部署于Unitree Go2四足机器人,无需针对特定环境进行微调。