--- title: "您的数据中心的电力架构发出了警告。它对此感到不满" type: "News" locale: "zh-CN" url: "https://longbridge.com/zh-CN/news/279198623.md" description: "高压直流(HVDC)电力架构的转变在数据中心变得至关重要,因为人工智能和 GPU 集群的电力需求不断上升。传统的 12V 和 48V 系统无法满足每个机架所需的数百千瓦,导致显著的电阻损耗和基础设施挑战。将配电电压提高到 400V 或 800V 可以减少电流并提高效率,从而最小化电力损耗。Nvidia 的 800VDC 架构承诺减少 45% 的铜材使用,解决了人工智能机架环境中的热量和结构限制" datetime: "2026-03-16T03:45:48.000Z" locales: - [zh-CN](https://longbridge.com/zh-CN/news/279198623.md) - [en](https://longbridge.com/en/news/279198623.md) - [zh-HK](https://longbridge.com/zh-HK/news/279198623.md) --- # 您的数据中心的电力架构发出了警告。它对此感到不满 特征超大规模计算建立在确定性的基础上。多年来,12V 和 48V 机架架构以稳定的 50–54 VDC(直流电压)为主导,完美设计以适应每个机架 10–15 kW 的功率密度。这些系统是经过精细调校的机器,围绕通用 CPU 和存储服务器的可预测、稳态需求进行了优化。基础设施是稳定的,数学是确定的。 然后,加速计算出现了,彻底打破了整个游戏规则。 GPU 集群和 AI 加速器不再遵循旧规则。它们不再要求 15 kW,而是每个机架需要数百千瓦,这一数量级的跃升是传统电气和热架构从未设计能够承受的。几十年来,数据中心设计中固有的舒适假设如今变成了负担,行业面临着无法再推迟的清算。 例如,Nvidia GB200 NVL72 机架级系统需要每个机架 120 kW。在这些功率水平下,低电压配电的物理特性面临挑战。以 48V 提供 120 kW 的要求需要超过 2.5 kA 的电流。要在一个机架内处理数千安培的电流,意味着需要厚的母线、重的铜质量、过热的连接器、显著的电阻损耗和可维护性问题。 AI 推动行业超越了 48V 的舒适区,限制因素是安全高效地传输电流。解决这一问题的一个新兴方案是提高配电电压(400V 或 800V),这在相同功率水平下减少了电流。这就是为什么行业现在正在向下一代 AI 工厂转向高压直流(HVDC)电力架构。 ### 48V 电力配电的挑战 让我们谈谈电流平方问题和电阻损耗。由于功率损耗与电流的平方成比例,即使是小幅度的电流减少也会导致效率显著提高。电力配电效率受焦耳电阻损耗(Ploss = I²R)控制。 在这个方程中,功率损耗与电阻线性相关,但与电流的关系是平方关系。这为维持低配电电压带来了非线性劣势,因为功率需求增加时,固定低电压下提供该功率所需的电流上升,从而导致更高的损耗。 对于 NVL72 机架系统,母线必须能够处理约 192 kW 的峰值电功率,对应超过 3.8 kA。即使在优化的母线电阻为 0.1 mΩ(0.0001 Ω)的情况下,这在整个机架高度上实现多个接头接口是困难的,电阻损耗仍然显著。使用焦耳电阻损耗,电阻损耗达到 625 W。 然而,在实际部署中,电阻包括接触接口、电缆终端和内部架子阻抗。所有这些因素使得复杂配电中的总路径电阻趋向于 0.5 mΩ或更高。在 0.5 mΩ时,损耗增加到 3125 W。 相比之下,对于等效的电力配电路径电阻,处理 150 A 的 800V 场景损耗为 2.25 W。即使我们假设高压基础设施使用电阻为 1 mΩ的更细连接器,损耗仍然仅为 22.5 W。转向 800V 将配电损耗减少了几个数量级。因此,在不损失千瓦的情况下,它们可以用于计算,而不是用于加热母线。 ### 铜过载和接触电阻 导体的载流量是指导体在超过其温度额定值之前能够承载的最大电流,这取决于横截面积。随着电流密度的增加,导体的横截面积必须增大以维持可接受的热限制。 为了在 48V 下承载 2.5 kA,OCP Open Rack v3(ORv3)规格依赖于一个巨大的、重的、实心铜母线。承载如此高电流的母线将非常沉重。这对数据中心基础设施施加了严重的结构负荷,并占用了空气流通和液体冷却所需的空间。 Nvidia 声称,800VDC 电力配电架构与传统配置相比可减少多达 45% 的铜。在 AI 机架的密集环境中,空气流通或液体冷却争夺空间,电力传输所占的体积是一个关键限制。 连接器物理学是接触电阻的第三个障碍。当电流上升时,机械接口上的电压降增加。这导致局部热量产生。在 2.5 kA 时,接触电阻仅 0.1 mΩ的降级会导致 625 W 的局部热量产生。 ### 新的电力层级 电力层级分为四个层次。在顶部(公用事业配电),电力以中压交流电(通常约 13.8 kV)进入。这个电力水平与传统设施相似,其中高压交流电在远距离传输电力时效率高。关键的变化是数据中心接下来发生的事情。新的设计旨在将交流电转换为直流电一次,然后进行分配,而不是在多个地方进行多次转换和降压。 在设施层面,新的方法是进行集中式的交流到直流转换,输出为高压直流。通过在源头附近整流为直流,数据中心可以消除许多中间的交流/直流转换,从而提高效率和可靠性。 这一概念在 Nvidia 800VDC 解决方案中得到了强调。他们建议将 13.8 kV 交流电源转换为 800VDC,并在数据中心内进行 800VDC 的配电。更少的转换阶段简化了备份。例如,电池系统可以直接连接到直流母线。 在今天的先进机架中,它们使用 48-54 VDC 母线。在 ORv3 中,每个机架有一个或多个电源架,接收设施的交流电(或直流电),并输出 50V 直流电到服务所有服务器的母线。典型的 ORv3 电源架是一个 1U 单元,提供高达 15 kW 或 18 kW 的总功率,多个电源架可以并联以支持更高的机架负载。 例如,Eaton 的 ORv3 电源架在 1U 中提供 18 kW,并连接到 48V 母线。这种架构相比 12V 机架有了显著的改进。然而,随着 AI 机架现在目标为 100+ kW,即使是 48V 的 ORv3 也接近其实际极限。未来的高压直流机架可能会接受 800V 的输入,并使用高效的 DC/DC 转换器将电压降至 48V 或 12V 的水平。 最终,每个服务器或加速器板必须转换为芯片使用的低电压。高电流电压调节模块接受 12V 或 48V 输入,并为处理器生成低于 1V 的电压。随着机架分配电压的上升,板载电源电子设备的负担也在增加。这就是氮化镓(GaN)和碳化硅(SiC)器件在前端 DC/DC 和中间母线转换器中越来越多使用的原因。 例如,Navitas Semiconductor 宣布了用于 Nvidia 800VDC AI 架构的新 GaN 和 SiC 组件,以提高从电网到 GPU 的效率和功率密度。 然而,今天的 AI GPU 工作负载在毫秒内可以消耗大量电力,因为神经网络的不同层与硬件交互。一次推理可能会在某一时刻让机架中的 72 个 GPU 处于空闲状态,然后突然每个 GPU 都达到其最大功率,以便同步进行全归约操作。这些瞬时负载变化带来了超出提供大功率的挑战。 在机架规模上,许多 GPU 同时运行可能会导致复合瞬态,其中电流和电压在电力分配网络中波动。因此,工程师担心当 GPU 在微秒内从 0 负载跃升至 100% 负载时,板上的 48V 或 12V 电压下降,或者母线和电缆上的 dI/dt 感应效应导致瞬时电压下降。 为了缓解这些突发情况,工程师们越来越多地将能量存储视为架构的一个重要组成部分。Nvidia 表示,处理负载峰值和亚秒级 GPU 功率波动的能量存储解决方案是其 800VDC 机架战略的一部分。 ### 从 ORv3 到 800V 当前一代数据中心电力架构是从以 12V 主板为中心的分配向 48V 机架级分配的显著提升,具有模块化和高效的特点。超大规模数据中心和 OCP 成员广泛采用 ORv3,显示出一个庞大的 48V 电源架、母线和兼容服务器的生态系统。 - 只有五分之一的欧洲数据中心具备 AI 准备能力,因为建设者面临土地和劳动力的困扰 - 高通宣布 AI 加速器和神秘机架 - AI 巨头呼吁能源网的和谐 - 企业在意识到 AI 的电力和冷却需求时将感到震惊 ORv3 机架已成为 AI 部署的支柱,支持 80 到 100+ kW 的扩展和 48V 电力分配的重并行化。例如,Meta 和 Microsoft 已围绕 48V 机架设计达成共识,如 OCP 贡献所示。 Nvidia 对 OCP 的最新贡献展示了一种增强型 48V 母线设计,额定电流约为每段 1400 A,突显出社区如何从低电压架构中提取额外的余量。这些努力也表明,我们在电流和热量方面接近低电压分配的极限。 下一个合乎逻辑的步骤是开发更高电压的直流分配标准。我们正处于一个过渡期,许多机架将继续使用 48V 一段时间,但针对大规模 AI 计算的新建机架已经在规划高压直流(HVDC)。Eaton、Vertiv 和 Delta 等公司正在开发兼容 800V 的整流器、转换器和电源电子设备,以应对这些变化。® ### 相关股票 - [NVDL.US](https://longbridge.com/zh-CN/quote/NVDL.US.md) - [NVDY.US](https://longbridge.com/zh-CN/quote/NVDY.US.md) - [NVDU.US](https://longbridge.com/zh-CN/quote/NVDU.US.md) - [NVDD.US](https://longbridge.com/zh-CN/quote/NVDD.US.md) - [NVDX.US](https://longbridge.com/zh-CN/quote/NVDX.US.md) - [NVDA.US](https://longbridge.com/zh-CN/quote/NVDA.US.md) ## 相关资讯与研究 - [SpaceX 获得对 Cursor 的 600 亿美元收购选择权](https://longbridge.com/zh-CN/news/283665221.md) - [人工智能的财富潮水,开始向 “瓶颈” 处流动](https://longbridge.com/zh-CN/news/283572773.md) - [人工智能编程初创公司 Cursor 洽谈融资 20 亿美元 估值超过 500 亿美元](https://longbridge.com/zh-CN/news/283186074.md) - [美国首次将人工智能纳入刑事调查范畴 有关监管迫在眉睫](https://longbridge.com/zh-CN/news/283651409.md) - [人工智能产业日报 (04.19) : 行业动态](https://longbridge.com/zh-CN/news/283263548.md)