AI 成了 COMPUTEX（台北國際電腦展）2024 當仁不讓的主角和焦點。在包括英偉達、Intel、AMD、高通、聯發科和 Arm 等在內的一眾各種終端芯片設計商中，英偉達當屬最受矚目者。6 月 5 日，英偉達股價創出新高，報收 1224.40 美元，漲幅 5.16%，市值追平蘋果，已達 3 萬億美元。英偉達聯合創始人兼 CEO 黃仁勳在 COMPUTEX2024 大會上更新了 AI GPU 技術路線圖：2025 年，英偉達將發佈 Blackwell Ultra，2026 年推出新架構 Rubin，2027 年發佈 Rubin Ultra。從 2023 年 10 月的投資者會議開始，英偉達將原本兩年一更新芯片新品的節奏，改成一年一更新。在那次會議上，黃仁勳宣佈，預計今年會推出 H200 和 B100 GPU；2025 年，英偉達 X100 GPU 也將面世。根據去年 10 月的規劃框架，英偉達 AI 芯片規劃的戰略核心是 “One Architecture” 統一架構，支持在任何地方做模型訓練和部署，無論是數據中心（IDC）還是邊緣設備，抑或 x86 和 Arm 架構。也就是説，英偉達 AI 芯片解決方案適用於超大規模數據中心的訓練任務，也可以滿足企業級用户的邊緣計算需求，涵蓋 x86 或新興的 Arm 架構生態。目前，英偉達同時擁有 GPU、CPU 和 DPU（數據處理單元：Data Processing Unit）的計算芯片和系統公司。通過 NVLink、NVSwitch 和 NVLink C2C 技術，英偉達將 CPU 和 GPU 做了靈活連接組合，形成統一的硬件架構，並與 CUDA 一起，形成完整的軟硬件生態。DPU 是一種專門用於數據處理的處理器。與通用處理器（CPU）和圖形處理器（GPU）不同，DPU 專注於數據處理，可以實現更高效的數據處理和計算。拋開黃仁勳的軟廣告宣傳，比如回顧了英偉達在過去的成功歷程、在算力方面降低成本的努力，以及 “是英偉達促成了當今的 AI 時代”，並且再次強調 CUDA 的 AI 平台級價值——正是因為有了 CUDA，全球的深度學習科學家們才能充分利用其潛力，從而推動了整個行業的進步——黃仁勳也展望了生成式 AI 時代的未來，這部分是本次大會英偉達的戰略公示重點。黃仁勳説，“我們現在所處的不是簡單的 AI 時代，而是一個生成式 AI 時代。在這個時代，幾乎所有事物都可以轉換成 Token（詞元），並通過生成式 AI 進行處理和優化。”“生成式 AI 將重塑各行各業，推動整個價值 3 萬億美元的 IT 產業轉型為 AI 工廠，為每個行業製作 AI 產品。” 黃仁勳説，“未來每台裝有 RTX 顯卡的 PC 都將成為 AI PC，能夠高效地處理和生成各種數據。”這是不是相當於 AI PC 有了黃氏定義？“每台裝有 RTX 顯卡的 PC 都將成為 AI PC”。更核心的焦點，實際上就是黃仁勳公佈英偉達 AI GPU 技術路線圖：到 2027 年之前，英偉達會更新 GPU 和 CPU 架構，以及 CPU+GPU 二合一超級芯片。黃仁勳表示，英偉達將堅持使用統一架構覆蓋整個數據中心 GPU 產品線，每年更新迭代一次。其中的核心，就是英偉達官宣了替代 “Blackwell” 架構的新一代 GPU 架構 “Rubin”。截至目前，英偉達高性能 GPU 架構代號 “Blackwell”，已實現量產，相關產品包括用於 HPC/AI 領域的 B200/GB200，以及用於遊戲的 RTX 50 系列。2025 年，Blackwell 迭代版 Blackwell Ultra 將得以面市；2026 年，新架構 “Rubin” 會推出：搭載下一代 HBM4 高帶寬內存（8 層堆棧）；2027 年，“Rubin” 的迭代版 “Rubin Ultra” 會推出，標準版的 HBM4 內存，由 8 層堆棧升級為 12 層堆棧。這裏有個細節很值得注意：“Rubin” 命名源於美國女天文學家 Vera Rubin（薇拉·魯賓）。CPU 方面，“Vera” 架構會取代 2022 年 3 月推出的 Grace CPU 超級芯片。“Vera” 架構名稱同樣源於 Vera Rubin——前者用於英偉達新一代 CPU 架構名稱，後者 Rubin 則成為英偉達新一代 GPU 架構的名稱。此前，英偉達在其 AI 路線圖中，並沒有將 “Grace” 作為一個獨立的 CPU 架構，而將之納入 “Grace+GPU” 的 SuperChip 超級芯片範疇。這在營銷層面的表達或許不夠清晰，但實際上體現了英偉達 “CPU+GPU 二合一超級芯片” 的策略；而此次官宣 “Vera Rubin” 之 “CPU+GPU” 架構，讓競對看到了英偉達在 AI 領域強悍的統治力。在 SuperChip 超級芯片架構中，NVLink-C2C 和 NVLink 互聯技術在英偉達未來的 AI 芯片架構中，將持續發揮關鍵作用。本次大會上，黃仁勳公示了 Vera CPU 和 Rubin GPU 組成新一代超級芯片的最新規劃：採用第六代 NVLink 互連總線，帶寬高達 3.6TB/s。NVLink-C2C 互聯技術的作用是什麼？英偉達以之構建 GH200、GB200 和 GX200 超級芯片；再通過 NVLink 互聯技術，兩顆 GH200、GB200 和 GX200 能被鏈接成 GH200NVL、GB200NVL 和 GX200NVL 模組。之後，英偉達能將之通過 NVLink 網絡組成超節點，再用 InfiniBand 或 Ethernet 網絡，最終組成更大規模的 AI 集羣。InfiniBand 或 Ethernet 網絡是什麼？這是英偉達交換芯片技術：前者瞄準 AI Factory，後者側重 AIGC Cloud。相較於 NVLink 總線域網絡，InfiniBand 和 Ethernet 屬於傳統網絡技術，兩種網絡帶寬比例大約為 1:9。在此次大會上，黃仁勳公佈了這兩條開放的芯片交互技術路線中的 InfiniBand 技術和產信息更新：新一代數據中心網卡 CX9 SuperNIC，最高帶寬可達 1600Gbps，也就是 160 萬兆，搭配新的 InfiniBand/以太網交換機 X1600。根據 2023 年 10 月舉行的英偉達投資者會議內容，以 InfiniBand 為基礎的 Quantum 系列和以 Ethernet 基礎的 Spectrum-X 系列將持續升級。預計到 2024 年，基於 100G SerDes 的 800G 接口的交換芯片將實現商用；2025 年，基於 200G SerDes 的 1.6T 接口的交換芯片也會面市。

CPU 和 GPU 新架構，已在路上。

賽道 Hyper | Vera Rubin：英偉達君臨 AI 天下秀