亚马逊开发专用冷却设备 应对 AI 时代 GPU 高能耗挑战

智通财经
2025.07.10 06:39
portai
我是 PortAI,我可以总结文章信息。

亚马逊云计算部门开发了专门用于冷却下一代英伟达 GPU 的硬件设备,以应对 AI 时代 GPU 高能耗的挑战。新设备 “列间换热器” 可插入现有及新建的数据中心,解决传统冷却方式的不足。客户可通过 AWS 的 P6e 计算实例使用这一服务,配合英伟达的高密度计算硬件,支持大型 AI 模型的训练和运行。

智通财经 APP 获悉,亚马逊 (AMZN.US) 周三表示,其云计算部门已开发出专门用于冷却下一代英伟达 (NVDA.US) 图形处理器 (GPU) 的硬件设备——这些 GPU 被广泛用于人工智能相关的计算任务。英伟达的 GPU 为生成式人工智能的爆发提供了强大动力,但它们消耗的能源极为庞大。这意味着,使用这些处理器的公司必须配备额外的设备来进行冷却。

亚马逊曾考虑建设能够广泛部署液冷系统的数据中心,以充分发挥这些高功耗英伟达 GPU 的效能。但亚马逊云服务 (AWS) 计算与机器学习服务副总裁 Dave Brown 表示,这一过程耗时太久,而且市面上可用的设备也无法满足需求。Dave Brown 表示:“它们要么占用过多的数据中心地面空间,要么显著增加用水量。虽然其中一些解决方案在其他服务提供商的小规模场景中可能有效,但它们根本没有足够的液冷能力来支持我们的规模。”

因此,亚马逊工程师构思并开发了 “列间换热器”(In-Row Heat Exchanger,简称 IRHX),这种设备可插入现有及新建的数据中心中。此前一代的英伟达芯片使用传统空气冷却方式已足够。

Dave Brown 表示,客户现在可以通过名为 P6e 的计算实例使用这一 AWS 服务。这些新系统配合英伟达设计的高密度计算硬件使用。英伟达的 GB200 NVL72 将 72 颗英伟达 Blackwell GPU 安装于单个机架中,并通过互联方式协同工作,以训练和运行大型 AI 模型。

亚马逊此前已推出多种自主研发的基础设施硬件。该公司开发了用于通用计算和人工智能的定制芯片,并设计了自有的存储服务器和网络路由器。通过运行自主硬件,亚马逊对第三方供应商的依赖减少,从而有助于提高盈利能力。在第一季度,AWS 交出了自 2014 年以来最佳运营利润率的成绩,该业务部门也贡献了亚马逊的大部分净利润。