返回行业动态

JetBrains 发布 120 亿参数 MoE 模型 Mellum2

2026/06/01 15:46
查看原文

OmniTools 6月1日消息,JetBrains 正式发布开源混合专家(MoE)语言模型 Mellum2,参数总量为 120 亿,每 token 激活约 25 亿参数,专为文本与代码联合任务优化。

该模型基于 Apache 2.0 许可证开源,支持路由决策、RAG 流程中的上下文压缩与后处理、智能体子任务(如规划与验证),以及私有化部署。官方称其推理速度较同类规模开源模型提升超 2 倍,适用于高吞吐、低延迟生产场景。

Mellum2 不追求通用大模型的广度,而是聚焦于软件工程工作流中的高频、轻量级组件角色,例如 IDE 内代码补全增强、多模型系统中的调度器或子代理。技术细节与基准测试结果已公开于 arXiv(编号 2605.31268)。