返回行业动态

Anthropic 发布 Claude Opus 4.6:支持 100 万上下文,多项基准测试领先

2026/04/15 15:21
查看原文

Anthropic 于 2026 年 2 月 5 日发布最新旗舰模型 Claude Opus 4.6。该模型在编码能力上进行了显著升级,能够更谨慎地规划、更长时间地维持智能体任务,并在大型代码库中运行更可靠,同时具备更强的代码审查和调试能力。值得注意的是,Opus 4.6 首次为 Opus 级别模型引入了 100 万 token 上下文窗口(测试版)。

在基准测试中,Opus 4.6 表现达到业界领先水平。它在智能体编码评估 Terminal-Bench 2.0 和复杂多学科推理测试 Humanity's Last Exam 上取得最高分;在衡量金融、法律等领域知识工作任务的 GDPval-AA 评估中,比 OpenAI 的 GPT-5.2 高出约 144 Elo,比上一代 Opus 4.5 高出 190 分。此外,在长上下文检索测试 MRCR v2 的 8-needle 1M 变体中,Opus 4.6 得分达 76%,远超 Sonnet 4.5 的 18.5%。

API 方面,Opus 4.6 新增了上下文压缩、自适应思考以及工作量控制功能,方便开发者平衡智能、速度与成本。该模型现已上线 claude.ai 及各大云平台,API 调用名称为 claude-opus-4-6,定价维持不变,为每百万 token 输入 5 美元、输出 25 美元。