Anthropic于2月17日正式发布Claude Sonnet 4.6。作为目前最强大的Sonnet模型,它在编码、计算机使用、长上下文推理、智能体规划及设计等方面实现了全面升级。该模型现已向所有Claude用户开放,并成为Free和Pro计划的默认模型。定价与Sonnet 4.5保持一致,为每百万token输入3美元、输出15美元。
在编码和推理方面,Sonnet 4.6表现显著提升。早期测试显示,开发者在70%的情况下更倾向于使用Sonnet 4.6而非前代,甚至在59%的情况下优于此前的旗舰模型Opus 4.5。该模型减少了过度工程和“偷懒”现象,幻觉更少,多步骤任务的一致性更强。此外,它推出了Beta版100万token上下文窗口,在长程规划和企业文档理解(OfficeQA)上达到了Opus 4.6的水平。
计算机使用能力是本次升级的重点。Sonnet 4.6在OSWorld基准测试中取得稳步进展,在处理复杂电子表格或多步骤网页表单等任务上展现出接近人类的能力,且对提示注入攻击的抵抗力较前代有重大提升。同时,API端新增了代码执行、记忆和程序化工具调用等通用功能,Claude Excel插件也开始支持MCP连接器。