本文作者:張逸凡 編輯:申思琦 來源:硬 AI 在 Computex 2024 上,黃仁勳(Jensen Huang)手持 Blackwell 芯片,再一次證明了英偉達的全棧能力。 相比於 GPU 賣家,全棧廠商需要考量的不再僅僅是 GPU,還包括軟件平台、網絡服務、散熱產品、配套 CPU 等產品。 英偉達 CEO 黃仁勳在此次大會上給出了一一的解答。 • 芯片一年一迭代:2025 年推出 Blackwell Ultra GPU、2026 年推出 Rubin GPU、2027 年推出 Rubin Ultra GPU; • 推出下一代架構:2026 年推出下一代架構 Rubin; • Spectrum-X“年更”:2026 年,Spectrum-X1600 可連接數百萬個 GPU; • 散熱不侷限於 “液冷”:Blackwell 架構同時推出風冷 DGX 和液冷 MGX 兩款服務器; • 軟件平台:軟件業務不僅是英偉達護城河,而且會成為一個巨大的生意; 一、處理器 首先,還是先來看一下英偉達的處理器,分別是 GPU 和 CPU。 會議上,黃仁勳説,“接下來更新節奏將以一年為週期,把所有產品推向技術極限。” 並重磅披露了未來三代的技術棧(見下圖): • 2025 年推出 Blackwell Ultra GPU(8S HBM3e 12H); • 2026 年推出 Rubin GPU(8S HBM4),以及新一代基於 Arm 的 Vera CPU,以及 NVLink 6 Switch(3600GB/s); • 2027 年推出 Rubin Ultra GPU(12S HBM4); 性能上,Rubin GPU 和 vera CPU 的具體參數暫未披露。但是英偉達在模型訓練上已經充分體現了體能提升,價格下降這一宗旨: • 過去 8 年,1.8 萬億參數 GPT-4 的訓練能耗,直接瘋狂降到 1/350,推理能耗降至 1/45000; • 過去 8 年,算力提升了 1000 倍; 二、處理器架構 黃仁勳揭露了 Blackwell 的下一代架構將是 Rubin 架構,將於 2026 年首次推出。新亮點是將配備HBM4 內存。 根據外媒 wccftech 報道,英偉達的 Rubin GPU 將採用台積電的 CoWoS-L 先進封裝技術,並採用 N3 製程工藝。 此外,英偉達將為 2026 年推出的 Rubin GPU 配備下一代HBM4 內存。目前,英偉達在其 B100 GPU 中使用的是最快的 HBM3E 內存。 這意味着在 2025 年底,HBM4 內存可能就會大規模生產。 另外,英偉達還將推出基於 ARM 架構的新一代 CPU —— Vera CPU,與 Rubin GPU 搭配,形成全新的 Vera Rubin 平台超級芯片。該平台將支持新的 CX9 SuperNIC 和 NVLink 6 技術,提供高達 1600GB/s 和 3600GB/s 的連接速度。 三、通信網絡 —— 以太網 此次大會上,英偉達首次提到了百萬級 GPU 互連的以太網絡解決方案,且預計將於 2026 年推出。屆時,3.2T 光模塊或將成為主流。 “數百萬 GPU 數據中心的時代即將到來!” 黃仁勳會上,出了未來三年的以太網絡 Spectrum 產品路線,並宣佈將每年推出新的 Spectrum-X 產品。 • 2024 年,Spectrum-X800 為數萬個 GPU 而設計; • 2025 年,X800 Ultra 為數十萬個 GPU 而設計; • 2026 年,X1600 則可擴展至數百萬個 GPU; 先前,不論是 Arista 還是英偉達,都僅公佈了十萬級別的 GPU 連接產品: • 英偉達:Spectrum-X 已經與多家客户進入了量產階段, 其中包括一個 10 萬 GPU 的大型集羣; • Arista:預測公司在 2025 年可以連接 10 萬 GPU; 根據會議(見下圖),2026 年交換機速率較 2024 年將會翻倍,意味着 2026 年光模塊或將進入 3.2T 時代(目前是 1.6T)。 四、風冷 DGX 和液冷 MGX Blackwell 推出後,市場一度傳出服務器將使用液冷來散熱。 此次大會上,英偉達提到,將同時構建風冷 DGX 和液冷 MGX兩種散熱模式的服務器產品。 此外,相比於先前的 GTC 大會,黃仁勳披露了更詳細的 Blackwell 架構的數據: • DGX 的 AI 算力提升到上一代的 45 倍,達到 1440PFLOPS,而能耗僅為上一代的 10 倍; • 新一代 DGX 能搭載 72 個 GPU,背後由 NVLink 5000 根電纜組成的主幹支持,能為一個機架節省 20kW 電能; 五、軟件開發平台 軟件業務不僅是英偉達護城河,而且會成為一個巨大的生意。 這些軟件業務包括:CUDA、NIM、Omniverse 等(見下圖)。 會議上,英偉達再次強調了 NIN 和 Omniverse 的重要性, 1)NVIDIA NIM 推理微服務能將企業部署生成式 AI 應用的時間從幾天壓縮到幾分鐘; 2)Omniverse:Omniverse 是一個虛擬世界模擬開發平台,該平台可以最大限度地減少模擬與現實的差距。開發者可以在 Omniverse 中測試、訓練和集成所有東西。正如視頻所説,機器人可以在虛擬世界裏學習如何成為機器人; 面向未來,英偉達積極佈局了機器人領域、以及開發基於 AI 技術的應用——Earth。通過不斷創新和探索,英偉達有望在推動全球技術進步和改善人類生活方面發揮更大的作用。