OmniTools 5月6日消息,NVIDIA 宣布在其 Spectrum-X 以太网架构中集成 Multipath Reliable Connection(MRC)协议,并将其作为开放规范提交至开放计算项目(OCP)。MRC 是一种 RDMA 传输协议,支持单个 RDMA 连接在多个网络路径间动态分发流量,显著提升吞吐量、负载均衡能力与网络可用性。
该协议已在 OpenAI、Microsoft 和 Oracle 的超大规模 AI 工厂中落地应用,包括 Microsoft Fairwater 与 Oracle Cloud Infrastructure Abilene 数据中心。OpenAI 表示,MRC 在 Blackwell 架构上的部署有效减少了网络相关中断,保障了前沿大模型训练任务的持续高效运行。
MRC 具备微秒级故障检测与硬件自动重路由能力,支持智能重传与细粒度流量路径管控;同时兼容 Spectrum-X 多平面网络设计,网络规模可扩展至数十万 GPU。NVIDIA 与 AMD、Broadcom、Intel、Microsoft 及 OpenAI 共同参与了 MRC 的开发。