賽道 Hyper | Vera Rubin:英偉達君臨 AI 天下秀

華爾街見聞
2024.06.06 01:49
portai
我是 PortAI,我可以總結文章信息。

CPU 和 GPU 新架構,已在路上。

AI 成了 COMPUTEX(台北國際電腦展)2024 當仁不讓的主角和焦點。

在包括英偉達、Intel、AMD、高通、聯發科和 Arm 等在內的一眾各種終端芯片設計商中,英偉達當屬最受矚目者。6 月 5 日,英偉達股價創出新高,報收 1224.40 美元,漲幅 5.16%,市值追平蘋果,已達 3 萬億美元。

英偉達聯合創始人兼 CEO 黃仁勳在 COMPUTEX2024 大會上更新了 AI GPU 技術路線圖:2025 年,英偉達將發佈 Blackwell Ultra,2026 年推出新架構 Rubin,2027 年發佈 Rubin Ultra。

從 2023 年 10 月的投資者會議開始,英偉達將原本兩年一更新芯片新品的節奏,改成一年一更新。在那次會議上,黃仁勳宣佈,預計今年會推出 H200 和 B100 GPU;2025 年,英偉達 X100 GPU 也將面世。

根據去年 10 月的規劃框架,英偉達 AI 芯片規劃的戰略核心是 “One Architecture” 統一架構,支持在任何地方做模型訓練和部署,無論是數據中心(IDC)還是邊緣設備,抑或 x86 和 Arm 架構。

也就是説,英偉達 AI 芯片解決方案適用於超大規模數據中心的訓練任務,也可以滿足企業級用户的邊緣計算需求,涵蓋 x86 或新興的 Arm 架構生態。

目前,英偉達同時擁有 GPU、CPU 和 DPU(數據處理單元:Data Processing Unit)的計算芯片和系統公司。通過 NVLink、NVSwitch 和 NVLink C2C 技術,英偉達將 CPU 和 GPU 做了靈活連接組合,形成統一的硬件架構,並與 CUDA 一起,形成完整的軟硬件生態。

DPU 是一種專門用於數據處理的處理器。與通用處理器(CPU)和圖形處理器(GPU)不同,DPU 專注於數據處理,可以實現更高效的數據處理和計算。

拋開黃仁勳的軟廣告宣傳,比如回顧了英偉達在過去的成功歷程、在算力方面降低成本的努力,以及 “是英偉達促成了當今的 AI 時代”,並且再次強調 CUDA 的 AI 平台級價值——正是因為有了 CUDA,全球的深度學習科學家們才能充分利用其潛力,從而推動了整個行業的進步——黃仁勳也展望了生成式 AI 時代的未來,這部分是本次大會英偉達的戰略公示重點。

黃仁勳説,“我們現在所處的不是簡單的 AI 時代,而是一個生成式 AI 時代。在這個時代,幾乎所有事物都可以轉換成 Token(詞元),並通過生成式 AI 進行處理和優化。”

“生成式 AI 將重塑各行各業,推動整個價值 3 萬億美元的 IT 產業轉型為 AI 工廠,為每個行業製作 AI 產品。” 黃仁勳説,“未來每台裝有 RTX 顯卡的 PC 都將成為 AI PC,能夠高效地處理和生成各種數據。”

這是不是相當於 AI PC 有了黃氏定義?“每台裝有 RTX 顯卡的 PC 都將成為 AI PC”。

更核心的焦點,實際上就是黃仁勳公佈英偉達 AI GPU 技術路線圖:到 2027 年之前,英偉達會更新 GPU 和 CPU 架構,以及 CPU+GPU 二合一超級芯片。

黃仁勳表示,英偉達將堅持使用統一架構覆蓋整個數據中心 GPU 產品線,每年更新迭代一次。其中的核心,就是英偉達官宣了替代 “Blackwell” 架構的新一代 GPU 架構 “Rubin”。

截至目前,英偉達高性能 GPU 架構代號 “Blackwell”,已實現量產,相關產品包括用於 HPC/AI 領域的 B200/GB200,以及用於遊戲的 RTX 50 系列。

2025 年,Blackwell 迭代版 Blackwell Ultra 將得以面市;2026 年,新架構 “Rubin” 會推出:搭載下一代 HBM4 高帶寬內存(8 層堆棧);2027 年,“Rubin” 的迭代版 “Rubin Ultra” 會推出,標準版的 HBM4 內存,由 8 層堆棧升級為 12 層堆棧。

這裏有個細節很值得注意:“Rubin” 命名源於美國女天文學家 Vera Rubin(薇拉·魯賓)。

CPU 方面,“Vera” 架構會取代 2022 年 3 月推出的 Grace CPU 超級芯片。“Vera” 架構名稱同樣源於 Vera Rubin——前者用於英偉達新一代 CPU 架構名稱,後者 Rubin 則成為英偉達新一代 GPU 架構的名稱。

此前,英偉達在其 AI 路線圖中,並沒有將 “Grace” 作為一個獨立的 CPU 架構,而將之納入 “Grace+GPU” 的 SuperChip 超級芯片範疇。

這在營銷層面的表達或許不夠清晰,但實際上體現了英偉達 “CPU+GPU 二合一超級芯片” 的策略;而此次官宣 “Vera Rubin” 之 “CPU+GPU” 架構,讓競對看到了英偉達在 AI 領域強悍的統治力。

在 SuperChip 超級芯片架構中,NVLink-C2C 和 NVLink 互聯技術在英偉達未來的 AI 芯片架構中,將持續發揮關鍵作用。

本次大會上,黃仁勳公示了 Vera CPU 和 Rubin GPU 組成新一代超級芯片的最新規劃:採用第六代 NVLink 互連總線,帶寬高達 3.6TB/s。

NVLink-C2C 互聯技術的作用是什麼?

英偉達以之構建 GH200、GB200 和 GX200 超級芯片;再通過 NVLink 互聯技術,兩顆 GH200、GB200 和 GX200 能被鏈接成 GH200NVL、GB200NVL 和 GX200NVL 模組。之後,英偉達能將之通過 NVLink 網絡組成超節點,再用 InfiniBand 或 Ethernet 網絡,最終組成更大規模的 AI 集羣。

InfiniBand 或 Ethernet 網絡是什麼?這是英偉達交換芯片技術:前者瞄準 AI Factory,後者側重 AIGC Cloud。相較於 NVLink 總線域網絡,InfiniBand 和 Ethernet 屬於傳統網絡技術,兩種網絡帶寬比例大約為 1:9。

在此次大會上,黃仁勳公佈了這兩條開放的芯片交互技術路線中的 InfiniBand 技術和產信息更新:新一代數據中心網卡 CX9 SuperNIC,最高帶寬可達 1600Gbps,也就是 160 萬兆,搭配新的 InfiniBand/以太網交換機 X1600。

根據 2023 年 10 月舉行的英偉達投資者會議內容,以 InfiniBand 為基礎的 Quantum 系列和以 Ethernet 基礎的 Spectrum-X 系列將持續升級。預計到 2024 年,基於 100G SerDes 的 800G 接口的交換芯片將實現商用;2025 年,基於 200G SerDes 的 1.6T 接口的交換芯片也會面市。