OmniTools 6月4日消息,英伟达正式发布Nemotron 3 Ultra模型,专为长时间运行的AI智能体设计。该模型支持多轮对话中持续保持上下文、调用外部工具及子智能体,并可高效处理复杂工作流任务。
随着多智能体协作场景普及,推理过程中的token数量快速增长,对计算资源与延迟提出更高要求。Nemotron 3 Ultra通过优化推理流程,在提升响应速度的同时显著降低计算成本。
此举旨在增强AI智能体在真实业务场景中的长期运行可行性,适用于需持续交互与自主决策的应用环境。
OmniTools 6月4日消息,英伟达正式发布Nemotron 3 Ultra模型,专为长时间运行的AI智能体设计。该模型支持多轮对话中持续保持上下文、调用外部工具及子智能体,并可高效处理复杂工作流任务。
随着多智能体协作场景普及,推理过程中的token数量快速增长,对计算资源与延迟提出更高要求。Nemotron 3 Ultra通过优化推理流程,在提升响应速度的同时显著降低计算成本。
此举旨在增强AI智能体在真实业务场景中的长期运行可行性,适用于需持续交互与自主决策的应用环境。