OmniTools 6月23日消息,字节跳动Seed团队正式发布Seed2.1系列模型,聚焦真实生产力场景下的智能体能力升级,重点强化通用Agent能力、代码工程交付能力及多模态理解能力。
Seed2.1 Pro在GDPval基准测试中取得最高分,在Agents' Last Exam中位列第一梯队;在MobileWorld手机GUI任务、CreativeWork多环境任务中均表现突出。多模态能力在CharXiv-RQ等多项基准测试中达到SOTA水平。
代码能力方面,Seed2.1 Pro在NL2Repo-Bench测试中表现良好,开发者评测显示其相较Claude Opus 4.6胜率达59.1%。该模型已集成至豆包与TRAE产品,API服务通过火山方舟平台开放。