返回行业动态

英伟达发布 Nemotron 3 Nano Omni 开源模型,提升多模态推理效率

2026/04/28 16:36
查看原文

英伟达正式推出 Nemotron 3 Nano Omni 模型,作为 Nemotron 3 系列新成员,该模型将视频、音频、图像与文本的推理能力整合至单一高效的开源架构中,旨在替代传统碎片化的多模态技术栈,降低智能体系统的编排复杂度与推理成本。

Nemotron 3 Nano Omni 基于 30B-A3B 混合专家(MoE)架构构建,结合 Mamba 层与 Transformer 层优化计算效率。在多项行业基准测试中,该模型在文档智能、视频与音频理解方面表现领先。在固定交互阈值下,其视频推理和多文档推理的有效系统容量分别较同类开源模型提升约 9.2 倍和 7.4 倍。

英伟达表示,该模型主要定位为智能体(Agentic)系统中的多模态感知与上下文子代理。Nemotron 3 Nano Omni 采用完全开放策略,提供模型权重、数据集及完整训练方案,支持开发者在本地、云端及企业环境中灵活定制与部署。