
2025OCP 算力大會:超節點 “Scale Up” 是全場焦點

大摩認為,OCP 算力大會上從 AMD 發佈的超寬 Helios 機櫃,到旨在顛覆供電格局的 800V 直流電源架構,再到谷歌的 2 兆瓦液冷單元,所有技術突破都圍繞着一個共同目標——構建規模更大、功率更高、能效更優的吉瓦級 AI 數據中心。
本文作者:鮑奕龍
來源:硬 AI
2025 年 OCP 全球峯會傳遞出明確信號,“Scale Up”(規模化擴展)架構已成為 AI 數據中心基礎設施建設的核心主題。
10 月 20 日摩根士丹利亞太團隊發表研報,指出為了滿足 AI 對算力永無止境的需求,整個行業正全力衝向更大規模、更高密度的 “Scale Up”(規模化擴展)架構。
研報指出,投資焦點需從通用服務器組件轉向能夠支持超節點架構的核心技術供應商。本次大會明確指出了四大技術趨勢與關鍵受益者:
- 更大機櫃:AMD Helios 超寬機櫃架構亮相,推動機櫃內組件升級,緯創(Wistron)和緯穎(Wiwynn)成為主要受益者。
- 更高功率:800V 直流(VDC)供電方案成為下一代標準,將顛覆數據中心供配電架構,台達電子(Delta)和貿聯(BizLink)處於領先地位。
- 更強冷卻:2 兆瓦級(2MW)液冷分配單元(CDU)成為焦點,其中谷歌的 Deschutes 方案備受矚目。
- 更快網絡:為 AI 優化的以太網(ESUN)和 CPO 交換機技術嶄露頭角,智邦科技(Accton)等網絡設備商將迎來升級機遇。
總而言之,整個行業都在為未來數年內即將到來的吉瓦級 AI 數據中心集羣做準備,能夠提供更高密度、更高效率解決方案的公司將在下一輪增長中佔據核心位置。
雙倍寬度機架開啓 Scale Up 新時代
“Scale Up”(規模化擴展)是為實現更高密度的單節點算力,而這正讓機櫃形態發生革命性變化。
AMD 聯合 Meta、緯穎等廠商共同推出了 Helios 機櫃。其關鍵特徵是採用了 ORW(Open Rack Wide)規格,寬度是傳統 ORV3 機櫃(21 英寸)的兩倍。
當前高性能芯片的浮點運算性能(FLOPs)密度極高,為了在低延遲環境下連接更多計算核心,必須將它們置於同一擴展域(scale-up domain)內。
在當前銅線連接的技術限制下,這隻能通過更大的背板或中板實現,從而催生了更大的機櫃。
Meta 認為未來必須實現解耦合,雖然短期內機架功率密度將繼續增加,但最終會因光學技術的應用而下降,擺脱銅互連的限制。
Helios 機架將於 2026 年下半年開始出貨,主要客户包括 Meta、甲骨文和 OpenAI。
根據供應鏈調查,緯穎是 Meta 的主要 ODM 合作伙伴,而緯創是 GPU 模塊、基板和交換機托盤的主要 ODM 合作伙伴,大多數 PCB 需要 M9 級 CCL 材料。
同時,這種超寬重型機櫃對機箱、導軌等機械部件提出了更高要求,利好勤誠(Chenbro)和川湖(King Slide)等供應商。
800 伏直流電源架構引領下一代高效千兆瓦 AI 工廠
隨着機櫃功率密度飆升,傳統供電架構已難以為繼。800V 直流(VDC)供電方案成為全場焦點,它被視為驅動下一代吉瓦級 AI 工廠的關鍵技術。
與傳統 50V 架構相比,800V 直流方案能在同等規格的銅纜上傳輸超過 150% 的電力,並能將電源使用效率(PUE)提升約 5%。
具體進展來看,台達電子已展出成熟的解決方案,包括 1.2MW 的固態變壓器(SST,已量產,3MW 以上正在設計中)、800V 電子保險絲(eFuse)、90kW 的 DC-DC 電源架和 12kW 的配電板。
預計新方案將使每瓦功率的供電價值比當前設計翻倍以上。貿聯(BizLink)等電源互連供應商也將因液冷母線等更嚴苛規格的需求而受益。
研報表示800V 直流方案預計將於 2027 年下半年隨英偉達的 Rubin Ultra 平台首次亮相。
大規模液冷系統成為焦點
散熱是決定算力能否穩定輸出的生命線。大會展示的技術路徑十分清晰,從當前混合散熱向全液冷演進。具體來看:
GB300 現狀: 已進入量產的 GB300 計算托盤採用的是混合散熱方案(85% 液冷/15% 風冷),每個計算托盤僅有 6 組快換接頭(QD)。良率已不再是市場擔憂的重點。
VR200 前瞻: 下一代 VR200 平台將是完全液冷,每個計算托盤的快換接頭將增至 14 組。目前已進入機櫃級生產和測試階段,預計 2026 年第三季度末交付。
CDU 大型化: 谷歌開源了其 2 兆瓦(MW)冷卻液分配單元(CDU)設計,支持高達 80 PSI 的壓力,為高階冷板設計提供可能。BOYD、酷冷至尊、台達電子和英維克均展示了相關產品。
報告援引 Promersion 的預測,儘管冷板技術在 2030 年前仍將是市場主流,但浸沒式液冷的拐點預計將在 2028 年出現。
網絡技術持續優化以應對 AI 需求
除了在節點內部規模化擴展(Scale Up)的解決辦法外,節點之間提升高速互聯(Scale Out)也是發揮 AI 集羣性能的關鍵。
研報指出為提升網絡性能而推出的以太網解決方案(ESUN)以及 CPO 交換機,已被廣泛應用於 Al 數據網絡的優化中。
然而,這些產品的可靠性、可維護性以及成本問題,依然是影響其廣泛應用的關鍵因素。具體進展來看:
- 智邦和天弘均展示了基於博通 Tomahawk 6 ASIC 的最新 1.6T 網絡交換機產品,預計將在 2026 年底或 2027 年初開始早期應用。智邦還展示了基於 Tomahawk 6 ASIC 和 IRIS 光波長交換機的 CPO 交換機概念驗證。
- Meta公佈的研究結果顯示,其 51.2T CPO(共封裝光學)交換機的年化鏈路故障率(ALFR)僅為 0.34%,遠優於可插拔光模塊的 1.58%,可靠性優勢明顯,但成本和可維護性仍是普及的關鍵。
- 與此同時,有源電纜(AEC)作為一種高性價比的方案正在崛起,在擴展網絡(Scale-out)中份額不斷提升。Meta 的 GB300 機櫃就採用了 AEC,這一趨勢預計將持續利好貿聯等供應商。
總而言之,2025 年 OCP 全球峯會釋放了一個極其明確的信號。AI 基礎設施的軍備競賽已進入 “巨型化” 階段,規模化擴展成為貫穿全場的核心主題。

