通义实验室发布Qwen-RobotNav：面向智能体导航的可扩展模型

OmniTools 6月16日消息，通义实验室正式发布Qwen-RobotNav导航模型。该模型基于Qwen3-VL架构，在1560万样本上训练完成，统一支持视觉语言导航、目标导航、目标跟踪、自动驾驶及具身问答五大任务，推理时无需修改模型结构即可灵活切换任务模式与观察参数。

在多项权威基准测试中，Qwen-RobotNav取得当前最优性能：VLN-CE RxR成功率达76.5%，HM3Dv2目标导航准确率75.6%（仅RGB输入），EVT-Bench跟踪率90.0%，NAVSIM PDMS得分91.4，并刷新三项具身问答（EQA）指标。

该模型开放四个可调节维度（视觉Token预算、时间衰减系数、相机权重及帧采样模式）。作为智能体系统的一部分，其配套上层规划器Qwen3.7-Plus在EXPRESS-Bench测试中性能提升15.4%，导航步数大幅减少77%。目前，该模型已实现零样本部署于Unitree Go2四足机器人，无需针对特定环境进行微调。