在光网络领域,英伟达罕见地选择与竞争对手及主要云厂商携手,共同组建OCI-MSA(光计算互连多源协议)联盟。该联盟的核心目标是制定统一的CPO(共封装光学)标准,使所有芯片制造商都能在同一框架下开发将数据包直接编码为光信号的光交换机。这一举动标志着英伟达首次主动打破其长期以来的技术垄断局面。
参与该联盟的巨头包括芯片制造商英伟达、Broadcom、AMD,以及云人工智能领域的领军企业微软、Meta和OpenAI。他们希望通过统一规范,构建一个灵活且多供应商的光互连生态系统,确保未来AI基础设施的互连需求不再受制于单一厂商。
此次合作的最大亮点在于英伟达的“破局”姿态。作为全球GPU霸主,英伟达此前一直坚持“单打独斗”的策略,其开发的量子-X(InfiniBand)和频谱-X(Ethernet)交换机均采用了先进的CPO技术,即把光子转换器集成在交换机芯片周围,而非传统的独立光模块。这种设计虽能大幅降低能耗和成本,但此前仅支持英伟达自家硬件,导致其他厂商难以兼容。
传统光互连方案面临严峻挑战:在高速数据传输中,铜缆因电阻限制传输距离极短,必须切换为光纤。然而,传统方案需在每根光纤两端安装独立的光电转换器,单根光纤成本高达数千欧元。英伟达的CPO方案通过将转换器集成在交换机内部,实现了规模效应,但前提是必须统一编码标准,这正是OCI-MSA联盟致力解决的核心问题。
推动此次合作的幕后推手主要是微软、Meta和OpenAI等超大规模云服务商。他们迫切希望打破对单一供应商的依赖,确保在供应链紧张时能灵活切换设备。通过制定标准,这些云厂商希望实现不同品牌设备间的无缝互操作,降低集成风险并缩短开发周期。
据悉,OCI-MSA 1.0版标准由AMD、Broadcom和Meta共同编写,其技术架构实际上采纳了英伟达首创的“光子环”设计。该标准规定,每个光连接器将支持双向800 Gbit/s的传输速率(单方向400 Gbit/s),并规划了未来向1.6 Tbit/s乃至3.2 Tbit/s演进的路径。这不仅规范了内部光子转换器的布局,还统一了数据包的编码格式。
长期以来,英伟达通过CUDA生态和Spectrum-X等专有协议构建了坚固的护城河,迫使客户只能采购其硬件。即便是网络设备巨头思科,也不得不销售贴牌的英伟达交换机才能进入AI集群市场,尽管其自有Silicon One芯片性能更优,却无法运行英伟达的专有协议。这种封闭性引发了业界的强烈反弹,促成了包括UEC(超以太网联盟)、UALink(替代NVLink)和ESUN(扩展以太网)在内的多个开源标准联盟的兴起。
尽管英伟达目前未完全加入UALink或UEC,仅以兼容姿态参与ESUN,但OCI-MSA的成立标志着行业风向的转变。对于中国AI基础设施从业者而言,这一趋势预示着未来AI网络建设将逐渐从“单一巨头绑定”转向“开放标准主导”,中国企业在参与全球光互连标准制定、布局CPO技术以及构建多元化供应链方面,将迎来更广阔的机遇与更公平的竞争环境。
