OmniTools 5月29日消息,Anthropic 正式发布 Claude Opus 4.8 模型。该版本在编码、智能体(Agent)能力、推理及实务知识工作等基准测试中全面优于前代 Opus 4.7,并支持更可靠的端到端任务执行。其在 Online-Mind2Web 测试中得分达 84%,并在 Legal Agent Benchmark 中首次突破 10% 全通过率标准。
新版本同步上线多项核心功能:claude.ai 新增“努力度控制(Effort Control)”,用户可自由调节模型响应深度与速度;Claude Code 推出“动态工作流”,支持数百个并行子智能体协同处理超大规模代码迁移任务;Opus 4.8 的 Fast Mode 运行速度提升至 2.5 倍,且单位成本较前代降低约三分之二。
在安全性与对齐性方面,Opus 4.8 表现显著提升。评估显示其忽略代码缺陷的概率较 Opus 4.7 降低约四倍,欺骗或误用协作行为率已接近当前对齐表现最佳的 Claude Mythos Preview。该模型即日起通过 claude.ai 及 API 全面开放,定价维持不变:标准模式为 5 美元/百万输入 Token、25 美元/百万输出 Token。