Anthropic 发布 Claude Opus 4.6：首次支持 100 万上下文，多项基准测试领先

2月5日，Anthropic 宣布推出其最新旗舰模型 Claude Opus 4.6。该模型在编码能力上进行了重大升级，能够更谨慎地规划、更长时间地维持智能体任务，并在大型代码库中运行更可靠，同时具备更强的代码审查和调试能力。值得注意的是，这是 Opus 级别模型首次在测试版中支持 100 万 token 的上下文窗口。

在性能表现上，Claude Opus 4.6 在多项评估中达到行业领先水平。它在智能体编码评估 Terminal-Bench 2.0 和复杂推理测试 Humanity's Last Exam 中均取得最高分；在衡量金融、法律等领域知识工作表现的 GDPval-AA 评估中，该模型比 OpenAI 的 GPT-5.2 高出约 144 Elo 分，比其前代 Opus 4.5 高出 190 分。此外，在长上下文检索测试（8-needle 1M MRCR v2）中，Opus 4.6 得分达 76%，远超 Sonnet 4.5 的 18.5%。

新模型还引入了自适应思考和新的工作量控制功能，允许开发者更好地平衡智能、速度和成本。在应用方面，Claude 在 Excel 中的功能得到大幅升级，并推出了 PowerPoint 的研究预览版。Claude Opus 4.6 现已在 claude.ai、API 及主要云平台上线，API 定价维持不变，为每百万 token 输入 5 美元、输出 25 美元。

Anthropic 发布 Claude Opus 4.6：首次支持 100 万上下文，多项基准测试领先

想继续了解，可以看这些

查看工具研究所长文

发现更多 AI 工具

Maniana

VibeBeats

Pushary

Replay QA

100亿美元买一个中转站？Stripe看中了OpenRouter什么

1134名AI员工联名“踩刹车”：OpenAI与Anthropic罕见联手背后的开源围剿

长鑫科技3.35万亿市值背后：十年亏损366亿后，单季暴赚247亿

Grok 4.5 对比主流 AI 工具：不同需求怎么选？

Grok 4.5 使用指南：适合谁、怎么配置、有哪些坑？

Claude

Remover.video

DeepSeek

Photo to Video AI Free

VidBG Remover