Anthropic 正式发布 Claude Opus 4.8 模型

OmniTools 5月29日消息，Anthropic 正式发布 Claude Opus 4.8 模型。该版本在编码、智能体（Agent）能力、推理及实务知识工作等基准测试中全面优于前代 Opus 4.7，并支持更可靠的端到端任务执行。其在 Online-Mind2Web 测试中得分达 84%，并在 Legal Agent Benchmark 中首次突破 10% 全通过率标准。

新版本同步上线多项核心功能：claude.ai 新增“努力度控制（Effort Control）”，用户可自由调节模型响应深度与速度；Claude Code 推出“动态工作流”，支持数百个并行子智能体协同处理超大规模代码迁移任务；Opus 4.8 的 Fast Mode 运行速度提升至 2.5 倍，且单位成本较前代降低约三分之二。

在安全性与对齐性方面，Opus 4.8 表现显著提升。评估显示其忽略代码缺陷的概率较 Opus 4.7 降低约四倍，欺骗或误用协作行为率已接近当前对齐表现最佳的 Claude Mythos Preview。该模型即日起通过 claude.ai 及 API 全面开放，定价维持不变：标准模式为 5 美元/百万输入 Token、25 美元/百万输出 Token。