英伟达发布Nemotron 3 Ultra模型，优化长时运行AI智能体推理效率

OmniTools 6月4日消息，英伟达正式发布Nemotron 3 Ultra模型，专为长时间运行的AI智能体设计。该模型支持多轮对话中持续保持上下文、调用外部工具及子智能体，并可高效处理复杂工作流任务。

随着多智能体协作场景普及，推理过程中的token数量快速增长，对计算资源与延迟提出更高要求。Nemotron 3 Ultra通过优化推理流程，在提升响应速度的同时显著降低计算成本。

此举旨在增强AI智能体在真实业务场景中的长期运行可行性，适用于需持续交互与自主决策的应用环境。