通义千问
适合中文内容、办公、客服、知识库、文本生成和多模态理解。
面向中文和通用文本任务的千问模型,覆盖高能力、平衡和低成本版本。
5 个版本
qwen3.7-max
qwen3.7-max 是千问 3.7 系列的高能力版本,适合复杂推理和多模态理解;价格高于 Plus 和 Flash。
复杂推理中文文本生成多模态理解
12 元 / MTok / 36 元 / MTok详情
qwen3.7-plus
qwen3.7-plus 在能力、速度和成本之间更均衡,官方建议作为多数文本和多模态应用的起点。
通用对话代码辅助图文视频理解
2 元 / MTok 起 / 8 元 / MTok 起详情
qwen3.6-flash
qwen3.6-flash 面向高频、低成本调用,适合在 Plus 效果足够后继续压低成本。
高频文本生成低成本任务简单对话
1.2 元 / MTok 起 / 7.2 元 / MTok 起详情
qwen3.5-omni-plus
qwen3.5-omni-plus 覆盖文本、图片、视频和音频输入,适合多模态理解任务。
多模态理解图文分析视频理解
文本/图像/视频 7 元 / MTok,音频 53 元 / MTok / 文本 40 元 / MTok,文本+音频 213 元 / MTok详情
qwen3.5-omni-plus-realtime
qwen3.5-omni-plus-realtime 面向实时多模态交互,价格结构按文本、图片和音频分别计费。
实时交互语音对话多模态助手
文本/图片 10 元 / MTok,音频 80 元 / MTok / 文本 60 元 / MTok,文本+音频 300 元 / MTok详情
向量与重排序
适合 RAG、搜索、问答系统和文档召回排序。
面向检索、知识库和排序优化的模型。
2 个版本
图像与视觉
适合商品图、创意图、视觉分析和多模态内容生产。
面向图像生成和视觉理解的模型。
2 个版本
| 模型版本 | 厂商 | 上下文 | 输入价格 | 输出价格 | 适合场景 |
|---|---|---|---|---|---|
| qwen3.7-max 通义千问 | Qwen 国内 | 1,000,000 tokens | 12 元 / MTok | 36 元 / MTok | 复杂推理中文文本生成多模态理解 |
| qwen3.7-plus 通义千问 | Qwen 国内 | 1,000,000 tokens | 2 元 / MTok 起 | 8 元 / MTok 起 | 通用对话代码辅助图文视频理解 |
| qwen3.6-flash 通义千问 | Qwen 国内 | 1,000,000 tokens | 1.2 元 / MTok 起 | 7.2 元 / MTok 起 | 高频文本生成低成本任务简单对话 |
| qwen3.5-omni-plus 通义千问 | Qwen 国内 | 暂未收录 | 文本/图像/视频 7 元 / MTok,音频 53 元 / MTok | 文本 40 元 / MTok,文本+音频 213 元 / MTok | 多模态理解图文分析视频理解 |
| qwen3.5-omni-plus-realtime 通义千问 | Qwen 国内 | 暂未收录 | 文本/图片 10 元 / MTok,音频 80 元 / MTok | 文本 60 元 / MTok,文本+音频 300 元 / MTok | 实时交互语音对话多模态助手 |
| text-embedding-v4 向量与重排序 | Qwen 国内 | 暂未收录 | 0.5 元 / MTok | 不适用 | 知识库检索语义搜索RAG 召回 |
| qwen3-rerank 向量与重排序 | Qwen 国内 | 暂未收录 | 文本输入 0.5 元 / MTok | 不适用 | 检索重排搜索排序知识库问答优化 |
| qwen-image-2.0-pro 图像与视觉 | Qwen 国内 | 不适用 | 不适用 | 0.5 元 / 张 | 图像生成商品图视觉创意 |
| tongyi-embedding-vision-plus 图像与视觉 | Qwen 国内 | 暂未收录 | 文本/图片/视频 0.5 元 / MTok | 不适用 | 图像检索视觉相似度多模态搜索 |