返回行业动态

Anthropic 发布 Claude Opus 4.6:首次支持 100 万上下文,多项基准测试领先

2026/04/15 12:36
查看原文

2月5日,Anthropic 宣布推出其最新旗舰模型 Claude Opus 4.6。该模型在编码能力上进行了重大升级,能够更谨慎地规划、更长时间地维持智能体任务,并在大型代码库中运行更可靠,同时具备更强的代码审查和调试能力。值得注意的是,这是 Opus 级别模型首次在测试版中支持 100 万 token 的上下文窗口。

在性能表现上,Claude Opus 4.6 在多项评估中达到行业领先水平。它在智能体编码评估 Terminal-Bench 2.0 和复杂推理测试 Humanity's Last Exam 中均取得最高分;在衡量金融、法律等领域知识工作表现的 GDPval-AA 评估中,该模型比 OpenAI 的 GPT-5.2 高出约 144 Elo 分,比其前代 Opus 4.5 高出 190 分。此外,在长上下文检索测试(8-needle 1M MRCR v2)中,Opus 4.6 得分达 76%,远超 Sonnet 4.5 的 18.5%。

新模型还引入了自适应思考和新的工作量控制功能,允许开发者更好地平衡智能、速度和成本。在应用方面,Claude 在 Excel 中的功能得到大幅升级,并推出了 PowerPoint 的研究预览版。Claude Opus 4.6 现已在 claude.ai、API 及主要云平台上线,API 定价维持不变,为每百万 token 输入 5 美元、输出 25 美元。