OmniTools 6月1日消息,NVIDIA 近日推出 Alpamayo 工具,旨在在闭环环境中对自动驾驶视觉-语言-动作(VLA)模型进行后训练,以弥合模型训练与实际部署之间的鸿沟。
当前主流自动驾驶模型多采用开放循环训练,仅将模型输出与真实行为进行静态比对,未充分考虑其决策对环境产生的动态反馈。Alpamayo 通过引入闭环仿真机制,使模型能够在持续交互中优化驾驶策略。
据 NVIDIA 官方介绍,该工具可有效提升模型对复杂驾驶场景的推理能力,并生成更丰富的中间推理过程,适用于自动驾驶策略的持续迭代与优化。