小米 MiMo 团队正式发布两款全新模型 MiMo-V2.5-Pro 和 MiMo-V2.5。这两款模型在智能体能力上取得显著突破,以更低的 Token 成本比肩当前顶尖的闭源前沿模型。两款模型现已通过 API 开放使用,并兼容 Claude Code、OpenCode 和 Kilo 等主流智能体框架。
旗舰模型 MiMo-V2.5-Pro 专注于长周期复杂任务,在 SWE-bench Pro(57.2)、Claw-Eval(63.8)和 τ3-Bench(72.9)等基准测试中与 Claude Opus 4.6 及 GPT-5.4 表现相当,且 Token 消耗减少 40-60%。该模型具备“工具链感知”能力,能自主优化工作环境。在实测中,它耗时 4.3 小时、672 次工具调用完成了满分通过的 Rust SysY 编译器,并在 11.5 小时内通过 1868 次工具调用生成了 8192 行代码的桌面视频编辑器。
MiMo-V2.5 则主打原生全模态与高性价比。该模型原生支持视觉与音频理解,上下文窗口达 100 万 Token。在多模态智能体基准 Claw-Eval 上得分 23.8,与 Claude Sonnet 4.6 持平;在 Video-MME 上得分 87.7,紧追 Gemini 3 Pro。在编程任务上,MiMo-V2.5 以一半的成本(1x 定价)达到了与 Pro 版本相当的水平,适合日常生产级智能体管线。此外,两款模型的 100 万上下文窗口均不再收取额外倍率费用。