可用文本图像输入工具调用

GPT-5.4 mini

mini 适合把 GPT 系列能力用在更高频、更低成本的任务里,是批量生产场景的优先候选。

官方模型 ID
gpt-5.4-mini

模型定位

GPT-5.4 mini 是 OpenAI 当前 GPT-5.4 系列里的低成本版本,官方强调代码、计算机使用和子任务代理能力。

适合场景

  • 高频代码辅助
  • 子任务拆解和工具调用
  • 成本敏感的批量分析、改写、摘要

价格与上下文

  • 输入价格:$0.75 / MTok
  • 缓存输入:$0.075 / MTok
  • 输出价格:$4.50 / MTok
  • 上下文窗口:400,000 tokens

选择建议

如果任务量大、结果允许再复核,mini 通常比旗舰模型更适合做默认生产版本。

能力评测

GPT-5.4 mini 官方评测对比

根据 OpenAI 发布 GPT-5.4 mini 和 nano 时披露的 benchmark 数据重绘,主要比较 GPT-5.4、GPT-5.4 mini、GPT-5.4 nano 和 GPT-5 mini。

OpenAI 发布页
重点模型
GPT-5.4 mini
更新时间:2026-03-17
代码

SWE-bench Pro (Public)

真实代码修复

GPT-5.4 mini
54.4%
GPT-5.4
57.7%
GPT-5.4 mini
54.4%
GPT-5.4 nano
52.4%
GPT-5 mini
45.7%
代码

Terminal-Bench 2.0

终端任务执行

GPT-5.4 mini
60.0%
GPT-5.4
75.1%
GPT-5.4 mini
60.0%
GPT-5.4 nano
46.3%
GPT-5 mini
38.2%
工具调用

Toolathlon

多工具任务

GPT-5.4 mini
42.9%
GPT-5.4
54.6%
GPT-5.4 mini
42.9%
GPT-5.4 nano
35.5%
GPT-5 mini
26.9%
推理

GPQA Diamond

高难科学问答

GPT-5.4 mini
88.0%
GPT-5.4
93.0%
GPT-5.4 mini
88.0%
GPT-5.4 nano
82.8%
GPT-5 mini
81.6%
电脑使用

OSWorld-Verified

看屏幕并操作界面

GPT-5.4 mini
72.1%
GPT-5.4
75.0%
GPT-5.4 mini
72.1%
GPT-5.4 nano
39.0%
GPT-5 mini
42.0%
多模态

MMMUPro

图文理解

GPT-5.4 mini
76.6%
GPT-5.4
81.2%
GPT-5.4 mini
76.6%
GPT-5.4 nano
66.1%
GPT-5 mini
67.5%
评测项能力方向GPT-5.4GPT-5.4 miniGPT-5.4 nanoGPT-5 mini
SWE-bench Pro (Public)真实代码修复57.7%54.4%52.4%45.7%
Terminal-Bench 2.0终端任务执行75.1%60.0%46.3%38.2%
Toolathlon多工具任务54.6%42.9%35.5%26.9%
GPQA Diamond高难科学问答93.0%88.0%82.8%81.6%
OSWorld-Verified看屏幕并操作界面75.0%72.1%39.0%42.0%
MMMUPro图文理解81.2%76.6%66.1%67.5%

评测分数适合用来快速了解模型在代码、推理、工具调用等方向的表现,实际选型还需要结合任务类型、价格和响应速度一起看。