DeepSeek发布V4预览版：最大开源MoE模型，编程与推理性能逼近前沿模型

中国AI实验室DeepSeek发布了最新大语言模型DeepSeek V4的两个预览版本：V4 Flash和V4 Pro。两款模型均采用混合专家（MoE）架构，上下文窗口达100万tokens。其中，V4 Pro拥有1.6万亿参数（490亿活跃参数），成为目前最大的开源权重模型；较小的V4 Flash则拥有2840亿参数（130亿活跃参数）。

DeepSeek表示，得益于架构改进，两款模型在效率和性能上均优于前代V3.2，并在推理基准测试上几乎“缩小了与当前领先模型的差距”。官方称V4-Pro-Max在推理基准上超越了开源同行，并在部分任务中击败了GPT-5.2和Gemini 3.0 Pro；在编程基准测试中，两款V4模型的表现与GPT-5.4相当。但在知识测试中，该模型略逊于GPT-5.4和Gemini 3.1 Pro等前沿模型，落后约3至6个月。此外，目前两款模型仅支持文本处理。

在定价方面，DeepSeek V4极具竞争力。V4 Flash的输入/输出价格分别为每百万tokens 0.14美元和0.28美元；V4 Pro的输入/输出价格分别为每百万tokens 0.145美元和3.48美元，均低于同级别竞品。此次发布正值美国指控中国大规模窃取美国AI实验室知识产权之际，DeepSeek此前也曾被Anthropic和OpenAI指控“蒸馏”其模型。