OmniTools 6月1日消息,英伟达在台北国际电脑展(Computex)上发布Nemotron 3 Ultra,总参数量达5500亿(激活参数550亿),为当前规模最大的Nemotron 3系列模型。
该模型在美国开源大模型中智能性表现最强,在Artificial Analysis Intelligence Index评测中得分为48,高于谷歌Gemma 4 31B(39分),但低于月之暗面Kimi K2.6(54分)。
推理性能方面,其预发布端点实测吞吐超300 tokens/s,显著高于同级别中国模型常见的50–100 tokens/s。模型将提供BF16权重及NVFP4量化版本,以优化部署效率。