
挑战英伟达!科技巨头成立联盟,制定 AI 加速器连接标准

英特尔、谷歌、微软、Meta 以及其他科技巨头周四宣布成立一个新的行业组织——“Ultra Accelerator Link (UALink) 推广组”,意在制定行业标准,领导数据中心中 AI 加速器芯片之间连接组件的发展,挑战英伟达在 AI 加速器一家独大的地位。分析认为,英伟达目前已提供互联技术,加上霸主地位稳固,目前英伟达没有动机也没有必要参与该联盟。
英特尔、谷歌、微软、Meta 以及其他科技巨头周四宣布成立一个新的行业组织——“Ultra Accelerator Link (UALink) 推广组”,意在制定行业标准,领导数据中心中 AI 加速器芯片之间连接组件的发展,挑战英伟达在 AI 加速器一家独大的地位。
联合制定 AI 加速器连接标准,挑战英伟达
除以上公司外,该组织成员还包括 AMD、惠普企业、博通和思科等,Arm 尚未参加。UALink 推广组正在提出一项新的行业标准,以连接日益增多的服务器中的 AI 加速器芯片。
“行业需要一个可以快速推进的开放标准,这种标准允许多家公司为整个生态系统增加价值,” AMD 数据中心解决方案总经理 Forrest Norrod 表示。“行业需要一个允许创新快速进行且不受任何单一公司限制的标准。”
广义上讲,AI 加速器是指 GPU 及其他定制设计的解决方案,用于加速 AI 模型的训练、微调和运行的芯片。UALink 提议的标准版本一,UALink 1.0,将连接多达 1024 个 GPU AI 加速器,组成一个计算 “集群”(pod),意指服务器中的一个或多个机架。根据 UALink 推广组的说法,基于包括 AMD 的 Infinity Fabric 在内的 “开放标准”,UALink 1.0 将允许 AI 加速器所附带的内存之间的直接加载和存储,并且与现有互连规范相比,总体上将提高速度,同时降低数据传输延迟,。
该组织表示,将在第三季度创建一个名为 UALink 的联盟,以监督 UALink 规范的发展。UALink 1.0 将在同一时间段内向加入联盟的公司提供,而带有更高带宽的迭代版规范 UALink 1.1,预计将在 2024 年第四季度推出。Norrod 表示,第一批 UALink 产品将在 “未来几年内” 推出。
英伟达:不想参加,也没必要
分析认为,由于明显缺少了当今最大的 AI 加速器生产商英伟达,该组织的成立就是为了挑战英伟达在 AI 领域一家独大的地位。目前,英伟达 AI 加速器的市场占有率估计在 80% 到 95%。
目前英伟达对此事未予置评,但很明显,该公司并不热衷于支持 UALink。分析认为,英伟达已经为数据中心服务器内的 GPU 链接提供了自己的专有互连技术,所以可能不太愿意支持基于竞争对手技术的规范。
而且,英伟达在 AI 领域的地位和影响力非常强大。在最近一个财季,英伟达的数据中心销售额(包括 AI 芯片销售)同比增长超过 400%。如果继续保持当前的轨迹,英伟达今年将有可能超越苹果,成为全球市值第二高的公司。
因此,英伟达不想参与,也不必参与 UALink。
而另一个尚未加入的大公司则是亚马逊。分析认为,亚马逊可能处于 “观望” 模式,因为该公司也在不断发展自己的内部加速器硬件努力。AWS 也可能认为,与供应其客户大量 GPU 的英伟达对抗没有太大的战略意义。
微软、Meta、谷歌最有动力
分析认为,除了 AMD 和英特尔,UALink 的最大受益者似乎是微软、Meta 和谷歌,这三家公司总计已经花费了数十亿美元购买英伟达的 GPU,以支持其云服务并训练其不断增长的 AI 模型。它们都希望摆脱英伟达作为 AI 硬件生态系统供应商过于强势的局面。
在最近的一份报告中,Gartner 估计,今年服务器中使用的 AI 加速器的价值将达到 210 亿美元,到 2028 年将增加到 330 亿美元。与此同时,Gartner 预计,到 2025 年 AI 芯片的收入将达到 334 亿美元。
谷歌有用于训练和运行 AI 模型的定制芯片——TPU 和 Axion。亚马逊拥有几个 AI 芯片家族。微软去年也加入了这场竞争,推出了 Maia 和 Cobalt。而 Meta 则在不断完善自己的加速器产品线。
此外,据报道,微软及其密切合作伙伴 OpenAI 计划在超级计算机上投资 1000 亿美元,用于训练配备未来版本的 Cobalt 和 Maia 芯片的 AI 模型。而这些芯片需要某种方式连接——也许这就是 UALink 的用途。

