Anthropic发布Claude Sonnet 4.6：编码与计算机使用能力全面升级

2月17日，Anthropic正式发布Claude Sonnet 4.6模型。该模型在编码、计算机使用、长上下文推理、智能体规划及设计等方面实现全面升级，并推出了支持100万token上下文窗口的测试版。目前，Claude Sonnet 4.6已成为claude.ai和Claude Cowork免费及Pro计划的默认模型，定价与Sonnet 4.5保持一致，为每百万token输入3美元/输出15美元。

在编码和推理方面，早期测试显示开发者在Claude Code中有70%的情况更倾向于使用Sonnet 4.6而非Sonnet 4.5，甚至有59%的情况更倾向于该模型而非此前的旗舰模型Opus 4.5。新模型减少了过度工程化和“偷懒”现象，幻觉更少，多步骤任务的一致性更强。在OfficeQA基准测试中，其文档理解能力已与Opus 4.6持平。

计算机使用能力是Sonnet 4.6的另一大亮点。在OSWorld基准测试中，该模型展现出显著进步，早期用户在处理复杂电子表格和多步骤网页表单时已观察到接近人类水平的表现。同时，新模型对提示注入攻击的抵抗力较Sonnet 4.5有大幅提升，安全性表现与Opus 4.6相当。

平台功能方面，Sonnet 4.6支持自适应思考、扩展思考以及上下文压缩（测试版）。API端的网页搜索和抓取工具现可自动编写并执行代码以过滤搜索结果，代码执行、记忆等功能已全面可用。该模型现已上线所有Claude计划、API及主要云平台。