Anthropic 于 2026 年 2 月 5 日发布最新旗舰模型 Claude Opus 4.6。该模型在编程、智能体任务及长上下文处理方面实现显著升级,并首次为 Opus 级别模型引入了 100 万 token 的上下文窗口(测试版)。
在基准测试中,Opus 4.6 表现达到行业领先水平。它在智能体编程评估 Terminal-Bench 2.0 和复杂多学科推理测试 Humanity's Last Exam 中均取得最高分。在经济价值知识工作评估 GDPval-AA 上,Opus 4.6 超越 OpenAI GPT-5.2 约 144 Elo 分,较前代 Opus 4.5 提升 190 分。此外,在长上下文检索测试 MRCR v2 中,Opus 4.6 得分达 76%,远超 Sonnet 4.5 的 18.5%。
新模型增强了代码审查、调试及日常办公任务处理能力,并引入了自适应思考与努力控制功能,允许开发者平衡智能、速度与成本。Claude Code 现支持组建智能体团队,API 支持上下文压缩以执行更长任务。同时,Excel 集成得到升级,并推出了 PowerPoint 研究预览版。Claude Opus 4.6 现已在 claude.ai 及各大云平台上线,API 定价维持不变,为每百万 token 5 美元/25 美元。