返回行业动态

通义千问发布Qwen-RobotWorld具身智能框架

2026/06/16 04:53
查看原文

OmniTools 6月16日消息,通义实验室正式推出Qwen-RobotWorld具身智能体框架。该框架以自然语言为统一动作接口,采用双流多模态扩散Transformer(MMDiT)架构,并集成Qwen2.5-VL作为动作编码器。

该框架在4个主流基准测试中取得领先性能,支持20余种机器人形态,基于860万跨场景训练对和1300多项操作技能进行训练;语言接口已标准化500多种动作类别,可实现操作、自动驾驶与室内导航的联合训练。

此外,Qwen-RobotWorld支持Scene2Robot人类动作到机器人动作的迁移,以及2–4路多视角几何一致视频生成。