返回行业动态

NVIDIA与Google Cloud推出A5X实例,AI推理成本降至上一代十分之一

2026/04/23 12:22
查看原文

在 Google Cloud Next 大会上,Google 与 NVIDIA 公布了旨在降低大规模 AI 推理成本的联合硬件路线图。双方正式推出基于 NVIDIA Vera Rubin NVL72 机架级系统的新型 A5X 裸金属实例。通过软硬件协同设计,该架构旨在将每 Token 推理成本降低至上一代的十分之一,同时将每兆瓦 Token 吞吐量提升十倍。

为应对超大规模集群的互联带宽挑战,A5X 实例集成 NVIDIA ConnectX-9 SuperNIC 与 Google Virgo 网络技术,支持单站点扩展至 8 万颗 NVIDIA Rubin GPU,多站点部署最高可达 96 万颗。

在企业级数据治理方面,搭载 NVIDIA Blackwell 系列 GPU 的 Google Gemini 模型已在 Google Distributed Cloud 开启预览,并引入 NVIDIA Confidential Computing 硬件级加密协议,确保敏感数据与模型训练全程隔离。此外,NVIDIA Nemotron 3 Super 模型已接入 Gemini Enterprise Agent Platform,双方同步推出基于 NVIDIA NeMo RL 的托管训练集群,以简化代理 AI(Agentic AI)的训练与运维。

在工业与物理 AI 领域,NVIDIA Omniverse 及 Isaac Sim 等工具已上线 Google Cloud,支持高精度数字孪生与机器人仿真。目前,OpenAI、Snap 及 Schrödinger 等企业已率先采用该架构,相关联合开发者社区规模已突破 9 万人。