NVIDIA与Google Cloud推出A5X实例，AI推理成本降至上一代十分之一

在 Google Cloud Next 大会上，Google 与 NVIDIA 公布了旨在降低大规模 AI 推理成本的联合硬件路线图。双方正式推出基于 NVIDIA Vera Rubin NVL72 机架级系统的新型 A5X 裸金属实例。通过软硬件协同设计，该架构旨在将每 Token 推理成本降低至上一代的十分之一，同时将每兆瓦 Token 吞吐量提升十倍。

为应对超大规模集群的互联带宽挑战，A5X 实例集成 NVIDIA ConnectX-9 SuperNIC 与 Google Virgo 网络技术，支持单站点扩展至 8 万颗 NVIDIA Rubin GPU，多站点部署最高可达 96 万颗。

在企业级数据治理方面，搭载 NVIDIA Blackwell 系列 GPU 的 Google Gemini 模型已在 Google Distributed Cloud 开启预览，并引入 NVIDIA Confidential Computing 硬件级加密协议，确保敏感数据与模型训练全程隔离。此外，NVIDIA Nemotron 3 Super 模型已接入 Gemini Enterprise Agent Platform，双方同步推出基于 NVIDIA NeMo RL 的托管训练集群，以简化代理 AI（Agentic AI）的训练与运维。

在工业与物理 AI 领域，NVIDIA Omniverse 及 Isaac Sim 等工具已上线 Google Cloud，支持高精度数字孪生与机器人仿真。目前，OpenAI、Snap 及 Schrödinger 等企业已率先采用该架构，相关联合开发者社区规模已突破 9 万人。