Anthropic 发布 Claude Opus 4.6：支持 100 万上下文，多项基准测试领先

Anthropic 于 2026 年 2 月 5 日发布最新旗舰模型 Claude Opus 4.6。该模型在编码能力上进行了显著升级，能够更谨慎地规划、更长时间地维持智能体任务，并在大型代码库中运行更可靠，同时具备更强的代码审查和调试能力。值得注意的是，Opus 4.6 首次为 Opus 级别模型引入了 100 万 token 上下文窗口（测试版）。

在基准测试中，Opus 4.6 表现达到业界领先水平。它在智能体编码评估 Terminal-Bench 2.0 和复杂多学科推理测试 Humanity's Last Exam 上取得最高分；在衡量金融、法律等领域知识工作任务的 GDPval-AA 评估中，比 OpenAI 的 GPT-5.2 高出约 144 Elo，比上一代 Opus 4.5 高出 190 分。此外，在长上下文检索测试 MRCR v2 的 8-needle 1M 变体中，Opus 4.6 得分达 76%，远超 Sonnet 4.5 的 18.5%。

API 方面，Opus 4.6 新增了上下文压缩、自适应思考以及工作量控制功能，方便开发者平衡智能、速度与成本。该模型现已上线 claude.ai 及各大云平台，API 调用名称为 claude-opus-4-6，定价维持不变，为每百万 token 输入 5 美元、输出 25 美元。

Anthropic 发布 Claude Opus 4.6：支持 100 万上下文，多项基准测试领先

想继续了解，可以看这些

查看工具研究所长文

发现更多 AI 工具

Maniana

VibeBeats

Pushary

Replay QA

100亿美元买一个中转站？Stripe看中了OpenRouter什么

1134名AI员工联名“踩刹车”：OpenAI与Anthropic罕见联手背后的开源围剿

长鑫科技3.35万亿市值背后：十年亏损366亿后，单季暴赚247亿

Grok 4.5 对比主流 AI 工具：不同需求怎么选？

Grok 4.5 使用指南：适合谁、怎么配置、有哪些坑？

Claude

Remover.video

DeepSeek

Photo to Video AI Free

VidBG Remover