返回行业动态

英伟达发布Nemotron 3 Ultra模型,优化长时运行AI智能体推理效率

2026/06/04 13:13
查看原文

OmniTools 6月4日消息,英伟达正式发布Nemotron 3 Ultra模型,专为长时间运行的AI智能体设计。该模型支持多轮对话中持续保持上下文、调用外部工具及子智能体,并可高效处理复杂工作流任务。

随着多智能体协作场景普及,推理过程中的token数量快速增长,对计算资源与延迟提出更高要求。Nemotron 3 Ultra通过优化推理流程,在提升响应速度的同时显著降低计算成本。

此举旨在增强AI智能体在真实业务场景中的长期运行可行性,适用于需持续交互与自主决策的应用环境。