返回行业动态

DeepSeek发布V4预览版:最大开源MoE模型,编程与推理性能逼近前沿模型

2026/04/24 13:34
查看原文

中国AI实验室DeepSeek发布了最新大语言模型DeepSeek V4的两个预览版本:V4 Flash和V4 Pro。两款模型均采用混合专家(MoE)架构,上下文窗口达100万tokens。其中,V4 Pro拥有1.6万亿参数(490亿活跃参数),成为目前最大的开源权重模型;较小的V4 Flash则拥有2840亿参数(130亿活跃参数)。

DeepSeek表示,得益于架构改进,两款模型在效率和性能上均优于前代V3.2,并在推理基准测试上几乎“缩小了与当前领先模型的差距”。官方称V4-Pro-Max在推理基准上超越了开源同行,并在部分任务中击败了GPT-5.2和Gemini 3.0 Pro;在编程基准测试中,两款V4模型的表现与GPT-5.4相当。但在知识测试中,该模型略逊于GPT-5.4和Gemini 3.1 Pro等前沿模型,落后约3至6个月。此外,目前两款模型仅支持文本处理。

在定价方面,DeepSeek V4极具竞争力。V4 Flash的输入/输出价格分别为每百万tokens 0.14美元和0.28美元;V4 Pro的输入/输出价格分别为每百万tokens 0.145美元和3.48美元,均低于同级别竞品。此次发布正值美国指控中国大规模窃取美国AI实验室知识产权之际,DeepSeek此前也曾被Anthropic和OpenAI指控“蒸馏”其模型。