OpenAI正式发布GPT-5.5,这是自GPT-4.5以来首个完全重新训练的基础模型。该模型专为智能体(Agentic)工作流设计,具备自主规划、工具调用、自我校验及多步骤任务执行能力,核心聚焦智能体编程、计算机操作、知识工作与早期科研四大场景。
核心性能表现
GPT-5.5在多项基准测试中表现突出:Terminal-Bench 2.0得分82.7%(领先Claude Opus 4.7与Gemini 3.1 Pro),GDPval得分84.9%,OSWorld-Verified达78.7%。在SWE-Bench Pro上,其端到端任务解决率为58.6%。高精度版本GPT-5.5 Pro在BrowseComp测试中取得90.1%的得分。
效率与定价
模型在保持与GPT-5.4相同延迟的同时,显著降低了完成同等Codex任务所需的Token消耗。API定价同步调整:标准版输入/输出分别为5美元/百万和30美元/百万Token;Pro版为30美元/百万和180美元/百万Token。OpenAI表示,Token效率的提升将有效抵消单价上涨,实际工作流综合成本有望降低。
发布与覆盖
GPT-5.5现已面向ChatGPT与Codex的Plus、Pro、Business及Enterprise用户全面推送。目前Codex平台周活跃开发者已突破400万。