前沿大模型
按厂商和具体版本整理主流大模型的上下文、价格与适用场景,帮助你在写作、代码、推理、多模态和长文档任务中快速缩小候选范围。
按任务和成本比较模型版本
| 模型版本 | 厂商 | 上下文 | 输入价格 | 输出价格 | 适合场景 |
|---|---|---|---|---|---|
| GPT-5.5 GPT 系列 | ChatGPT 海外 | 1,050,000 tokens | $5 / MTok | $30 / MTok | 复杂推理专业代码长上下文分析 |
| GPT-5.5 Pro GPT 系列 | ChatGPT 海外 | 1,050,000 tokens | $30 / MTok | $180 / MTok | 最高难度推理高价值代码任务精度优先分析 |
| GPT-5.4 GPT 系列 | ChatGPT 海外 | 1,050,000 tokens | $2.50 / MTok | $15 / MTok | 专业代码复杂办公任务成本与能力平衡 |
| GPT-5.4 mini GPT 系列 | ChatGPT 海外 | 400,000 tokens | $0.75 / MTok | $4.50 / MTok | 成本敏感代码任务子任务代理批量内容处理 |
| GPT-5.4 nano GPT 系列 | ChatGPT 海外 | 400,000 tokens | $0.20 / MTok | $1.25 / MTok | 简单分类短文本改写批量摘要 |
| Claude Fable 5 Claude | Claude 海外 | 1,000,000 tokens | $10 / MTok | $50 / MTok | 高难度推理复杂代码任务专业分析 |
| Claude Mythos 5 Claude | Claude 海外 | 1,000,000 tokens | $10 / MTok | $50 / MTok | 前沿研究受邀测试项目高难度任务评估 |
| Claude Opus 4.8 Claude | Claude 海外 | 1,000,000 tokens | $5 / MTok | $25 / MTok | 代码任务长程智能体任务专业写作 |
| Claude Opus 4.7 Claude | Claude 海外 | 暂未收录 | $5 / MTok | $25 / MTok | 复杂任务代码任务专业写作 |
| Claude Sonnet 4.6 Claude | Claude 海外 | 1,000,000 tokens | $3 / MTok | $15 / MTok | 日常写作客服与运营常规代码辅助 |
| qwen3.7-max 通义千问 | Qwen 国内 | 1,000,000 tokens | 12 元 / MTok | 36 元 / MTok | 复杂推理中文文本生成多模态理解 |
| qwen3.7-plus 通义千问 | Qwen 国内 | 1,000,000 tokens | 2 元 / MTok 起 | 8 元 / MTok 起 | 通用对话代码辅助图文视频理解 |
| qwen3.6-flash 通义千问 | Qwen 国内 | 1,000,000 tokens | 1.2 元 / MTok 起 | 7.2 元 / MTok 起 | 高频文本生成低成本任务简单对话 |
| qwen3.5-omni-plus 通义千问 | Qwen 国内 | 暂未收录 | 文本/图像/视频 7 元 / MTok,音频 53 元 / MTok | 文本 40 元 / MTok,文本+音频 213 元 / MTok | 多模态理解图文分析视频理解 |
| qwen3.5-omni-plus-realtime 通义千问 | Qwen 国内 | 暂未收录 | 文本/图片 10 元 / MTok,音频 80 元 / MTok | 文本 60 元 / MTok,文本+音频 300 元 / MTok | 实时交互语音对话多模态助手 |
| text-embedding-v4 向量与重排序 | Qwen 国内 | 暂未收录 | 0.5 元 / MTok | 不适用 | 知识库检索语义搜索RAG 召回 |
| qwen3-rerank 向量与重排序 | Qwen 国内 | 暂未收录 | 文本输入 0.5 元 / MTok | 不适用 | 检索重排搜索排序知识库问答优化 |
| qwen-image-2.0-pro 图像与视觉 | Qwen 国内 | 不适用 | 不适用 | 0.5 元 / 张 | 图像生成商品图视觉创意 |
| tongyi-embedding-vision-plus 图像与视觉 | Qwen 国内 | 暂未收录 | 文本/图片/视频 0.5 元 / MTok | 不适用 | 图像检索视觉相似度多模态搜索 |
| Gemini 3.1 Pro Preview Gemini | Gemini 海外 | 1,048,576 tokens | $2 / MTok 起 | $12 / MTok 起 | 复杂推理代码任务多模态理解 |
| Gemini 3.5 Flash Gemini | Gemini 海外 | 1,048,576 tokens | $0.50 / MTok | $3 / MTok | 智能体循环代码辅助多模态理解 |
| Gemini 2.5 Pro Gemini | Gemini 海外 | 1,048,576 tokens | $1.25 / MTok 起 | $10 / MTok 起 | 复杂代码数学与 STEM长文档分析 |
| Gemini 2.5 Flash Gemini | Gemini 海外 | 1,048,576 tokens | $0.30 / MTok | $2.50 / MTok | 高频调用多模态理解成本平衡任务 |
| Gemini 2.5 Flash-Lite Gemini | Gemini 海外 | 1,048,576 tokens | $0.10 / MTok | $0.40 / MTok | 大规模分类字段提取低延迟任务 |
| Grok 4.3 Grok | Grok 海外 | 1,000,000 tokens | $1.25 / MTok | $2.50 / MTok | 长上下文问答工具调用复杂推理 |
| Grok Build 0.1 Grok | Grok 海外 | 256,000 tokens | $1.00 / MTok | $2.00 / MTok | 代码 Agent仓库级代码修改快速开发任务 |
| deepseek-chat DeepSeek API 模型 | DeepSeek 国内 | 64,000 tokens | $0.27 / MTok | $1.10 / MTok | 中文文本任务代码辅助低成本批处理 |
| deepseek-reasoner DeepSeek API 模型 | DeepSeek 国内 | 64,000 tokens | $0.55 / MTok | $2.19 / MTok | 复杂推理数学题代码推理 |
| Kimi K2.7 Code Kimi K 系列 | Kimi 国内 | 262,144 tokens | $0.95 / MTok | $4.00 / MTok | 长上下文代码代码 Agent复杂工具调用 |
| Kimi K2.7 Code HighSpeed Kimi K 系列 | Kimi 国内 | 262,144 tokens | $1.90 / MTok | $8.00 / MTok | 高速代码生成交互式代码 Agent长上下文开发任务 |
| Kimi K2.6 Kimi K 系列 | Kimi 国内 | 262,144 tokens | $0.95 / MTok | $4.00 / MTok | 通用智能任务视觉理解长上下文推理 |
| Kimi K2.5 Kimi K 系列 | Kimi 国内 | 262,144 tokens | $0.60 / MTok | $3.00 / MTok | 成本更低的长上下文任务多模态理解中文生成 |
| Llama 4 Scout Llama 4 | Llama 海外 | 10,000,000 tokens | 无 | 无 | 超长上下文自部署多文档总结 |
| Llama 4 Maverick Llama 4 | Llama 海外 | 暂未收录 | 无 | 无 | 多模态理解通用助手创意写作 |
| MiMo V2.5 Pro MiMo V2.5 系列 | MiMo 国内 | 1,000,000 tokens | 3 元 / MTok | 6 元 / MTok | 长程 Agent代码任务复杂推理 |
| MiMo V2.5 MiMo V2.5 系列 | MiMo 国内 | 1,000,000 tokens | 1 元 / MTok | 2 元 / MTok | 全模态理解图片问答音视频理解 |
| GLM-5.1 GLM-5 系列 | GLM 国内 | 200,000 tokens | 6 元 / MTok 起 | 24 元 / MTok 起 | Agentic Coding长程工程任务复杂办公 |
| GLM-Image GLM-5 系列 | GLM 国内 | 文本最大 1,000 字符 | 0.1 元 / 次 | 按次计费 | 图像生成中文文字渲染海报设计 |
| MiniMax-M3 MiniMax M 系列 | MiniMax 国内 | 1,000,000 tokens | $0.30 / MTok 起 | $1.20 / MTok 起 | 多模态 Agent代码任务长上下文 |
| MiniMax Hailuo 2.3 MiniMax M 系列 | MiniMax 国内 | 视频 6s / 10s 生成规格 | $0.28 / 768P 6s 起 | 按视频计费 | 视频生成图生视频物理运动生成 |
| Doubao Seed 2.0 Pro Doubao Seed 系列 | 豆包 Seed 国内 | 128,000 tokens | 3.2 元 / MTok 起 | 16 元 / MTok 起 | 复杂推理多模态理解Agent 任务 |
| ERNIE 5.1 文心 ERNIE | 文心 国内 | 128,000 tokens | 4 元 / MTok 起 | 18 元 / MTok 起 | 中文问答工具调用长文档 |
| ERNIE X1.1 Preview 文心 ERNIE | 文心 国内 | 187,392 tokens | 1 元 / MTok | 4 元 / MTok | 思考模式中文推理联网搜索 |
| Tencent HY 2.0 Think 混元 | 混元 国内 | 128,000 tokens | 3.975 元 / MTok 起 | 15.9 元 / MTok 起 | 复杂推理代码生成Agent |
| Tencent HY 2.0 Instruct 混元 | 混元 国内 | 128,000 tokens | 3.18 元 / MTok 起 | 7.95 元 / MTok 起 | 通用对话指令遵循文学创作 |
OpenAI / ChatGPT
OpenAI 的 GPT 系列覆盖旗舰推理、专业代码、低成本高频调用和 ChatGPT 即时对话,是海外模型选型里最常被拿来做基准比较的一组模型。
Anthropic / Claude
Claude 系列主打复杂推理、代码任务、长程工作和稳健输出,适合需要高可靠性的团队工作流。
通义千问 / Qwen
通义千问由阿里云百炼提供,覆盖文本、图像、视频、向量、重排序等多种模型能力。
Google / Gemini
Gemini API 覆盖长上下文、多模态输入、工具调用、代码执行和搜索增强,适合把 Google 生态能力接入应用和智能体工作流。
xAI / Grok
xAI 的 Grok 系列覆盖通用对话、推理、工具调用和代码工作流,官方 API 当前主推 Grok 4.3 与 Grok Build 0.1。
DeepSeek
DeepSeek API 以 deepseek-chat 和 deepseek-reasoner 作为常用模型名,覆盖非思考模式和思考模式。
Moonshot / Kimi
Moonshot 的 Kimi API 覆盖 Kimi K 系列多模态模型和 Moonshot V1 文本生成模型,当前官方主推 Kimi K2.7 Code 与 Kimi K2.6。
Meta / Llama
Meta Llama 4 系列以开源权重形式发布,Scout 和 Maverick 是官方已发布的原生多模态 MoE 模型。
小米 / MiMo
小米 MiMo 覆盖长上下文 Agent、全模态理解、语音识别和语音合成,V2.5 系列是当前官方主推模型。
智谱 / GLM
智谱 GLM 覆盖 GLM-5.1、GLM-5、视觉理解、图像生成和 Agent 工作流,是国内平台型模型服务之一。
MiniMax
MiniMax API 覆盖 M 系列语言模型、Hailuo 视频、Speech 语音、Image 图像和 Music 音乐生成。
字节 / 豆包 / Seed
豆包 Seed 系列通过火山方舟提供模型服务,覆盖通用推理、多模态理解、代码和图像/视频生成能力。
百度 / 文心 / 千帆
百度千帆提供 ERNIE 5.1、ERNIE 5.0、ERNIE X1.1、ERNIE 4.5 Turbo 等模型,覆盖文本、多模态和 Agent 场景。
腾讯 / 混元
腾讯混元覆盖 HY 2.0 Think、HY 2.0 Instruct、T1、TurboS、a13b、Vision 和生图等模型能力。