OmniTools 5月29日消息,Anthropic 正式发布其最新旗舰模型 Opus 4.8,距上一版本 Opus 4.7 仅隔41天,升级周期显著缩短。
新模型在基准测试中表现领先,并强化了对不确定或异常输入的识别能力。官方表示,Opus 4.8“更倾向于主动标记自身推理中的不确定性,且更少做出缺乏依据的断言”。早期测试反馈显示,该模型能更主动识别分析过程中的输入与输出问题,有效降低同类模型常忽略的潜在风险。
同步推出的“动态工作流”(Dynamic Workflows)功能目前处于研究预览阶段,旨在支持大模型协调数百个并行子智能体,以完成代码库级迁移等复杂任务。Anthropic 指出,Claude Code 结合 Opus 4.8 已可实现从启动到合并的全链路代码迁移,覆盖数十万行代码,并以现有测试套件作为质量基准。