
賽道 Hyper | 三星欲拔 CXL 市場頭籌能如願否?

戰事激烈,優勢微弱。
作者:周源/華爾街見聞
GenAI(生成式人工智能:Generative Artificial Intelligence)應用的飛速發展,在推升英偉達超越三星電子成為全球第二大半導體(營收)廠商的同時,也讓為英偉達 AI 加速卡提供 HBM(高帶寬存儲器:High Bandwidth Memory)的 SK 海力士賺得缽滿盆滿。
得益於 2021 年對 HBM 未來市場潛力的正確預判,海力士如今在 HBM 市場叱吒風雲,銷量市佔率為全球第一且相比排名第二的三星電子而言,做到了名副其實的 “遙遙領先”。
三星電子意識到在 HBM 市場落後於海力士之後,發動戰術反攻,希望搶回被海力士佔據的全球第一寶座。
三星電子在 GenAI 領域的戰術手段包括兩個方向:第一,開發 Mach 系列(目前正研發 1,規劃研發 2),挖英偉達牆角;第二,推動 CXL(Compute Express Link)內存標準研發,為英偉達和自己家 Mach 系列在實現高存儲容量的同時,也能提升數據傳輸速率。
海力士領先:三星對策?
英偉達是 HBM 的全球最大買家,這種超級 “芯片” 已成為 AI 圖形處理單元的關鍵組件。SK 海力士是英偉達當前代際存儲芯片 HBM3 和 HBM3E 的唯一供應商。在 HBM3E 全球市場,海力士市佔率介於 75%-80% 之間。
SK 海力士已開始批量生產其下一代芯片 HBM3E(第六代際),美光科技(Micron)也加入了這一行列。此前不久,這兩家公司都已宣佈其 HBM3E 今年所有產能都被英偉達預訂一空。與此相比,三星供應英偉達的 HBM3E 目前尚處於資格測試階段。
HBM 是一種由多個 DRAM 芯片堆疊而成的芯片立體芯片組。這些 DRAM 芯片通過硅通孔(TSV)的微細導線在垂直堆疊層之間實現相互連接。2014 年首款 HBM 芯片問世。
HBM 芯片容量從 1GB 升級至 24GB,帶寬從 128GB/s 提升至 819GB/s,數據傳輸速率也從 1Gbps 提高至 6.4Gbps。
由於提升芯片有限面積上的晶體管數量難度增加,為了維持摩爾定律的有效性,故而將堆疊作為一種技術而非擴展以推動各種芯片(也包括 3D NAND)性能超越極限的策略,在 2010 年開始為業界推重。
截至 2024 年 3 月,全球能穩定供應 HBM3 產品的供應商是韓國 SK 海力士、三星電子和美光科技。其中,海力士和美光科技能穩定供應 HBM3E。
三星電子在 2020 年前,原本是這種技術的領導者。2015 年,三星電子全球首發 HBM2 芯片;2021 年,海力士後來居上,成為全球首家能提供 HBM3 的廠商。此後,2019 年,三星電子解散 HBM 業務和技術團隊。海力士抓住機會,順勢成為 HBM 全球霸主。
2022 年 11 月 30 日,ChatGPT 橫空出世,HBM 成為英偉達 AI 加速卡最重要的高帶寬內存芯片。當年全球 50% 的 HBM 出貨來自 SK 海力士,三星佔比 40%,美光佔 10%。
但在 HMB3E 細分市場,海力士全球市佔率高達 75%-80%,而三星電子尚未有資格為英偉達供應這個代際的 HBM3E 芯片。
由此,海力士取得了戰略層面的重大勝利。
三星電子反應極大:今年 1 月和 3 月,三星電子先後成立兩個 HBM 技術團隊;3 月 19 日,在全球芯片製造商 Memcon 2024 會上,三星副總裁兼 DRAM 產品和技術主管 Hwang Sang-joong 透露,三星電子將批量大規模生產 12 層第五代 HBM(即 HBM3E)。
同時,Hwang Sang-joong 公佈了 HMB 技術路線圖,預計 2026 年 HBM 出貨量將是 2023 年產量的 13.8 倍。到 2028 年,HBM 年產量將進一步增至 2023 年水平的 23.1 倍。
根據三星電子的 HBM 技術路線圖,2026 年三星電子的主力 HBM 產品應該是第五代 HBM3E 和第六代 HBM4。其中,前者將大幅提高堆疊數量。三星在會上展示 HBM3E 12H 芯片——業界首款 12 層堆棧的 HBM3E,這標誌着 HBM 技術有史以來實現了最高容量的突破。
公開消息顯示,三星電子正在向英偉達提供 HBM3E 12H 芯片樣品,計劃在 2024 年上半年開始量產。
不僅如此,作為全球半導體產業鏈最長、最全的三星電子,在 GenAI 市場的戰術反攻,目標對象不僅只想拉海力士下馬,同時也將競爭壓力迫向英偉達,但實現路徑較為間接。
三星半導體業務負責人 Kyung Kye-hyun 在 3 月下旬表示,三星正在開發下一代 AI 芯片 Mach-1,目的是分英偉達的 AI 加速卡蛋糕。
據三星介紹,Mach-1 是一種片上系統(SoC)形式的 AI 加速卡,能減少圖形處理單元(GPU)和 HBM 之間的數據傳播速率瓶頸。這款技術產品為英偉達下游採購商韓國搜索巨頭 Naver 採用,合同規模高達 7.52 億美元。
CXL 市場:鹿死誰手未可知
鑑於三星電子在 HBM 戰略層面的落後,只能靠技術代際超越奪回海力士全球第一的寶座。
三星電子的殺手鐧,就是 CXL 技術。
在 Memcon 2024 會上,三星執行副總裁 Han Jin-man 披露了三星 CXL 技術和願景。
CXL 技術是一種高速、大容量中央處理器(CPU)到設備以及 CPU 到內存連接的開放標準,專為高性能數據中心計算機而設計。
鑑於 CXL 技術原理較為複雜(與 PCIe<Peripheral Component Interconnect Express>技術有關),故而只談 CXL 的作用:採用 CXL 技術的內存,在實現高存儲容量時,能克服常見 DIMM 內存的性能和插槽封裝限制。應用方面,涉及軟硬件兩個層面——服務器和存儲產品與解決方案。
2023 年初,AMD 發佈的第四代 EPYC(代號 Genoa)和英特爾發佈的第四代 Xeon Scalable(代號 Sapphire Rapids)處理器平台,構建了 CXL 的應用硬件端,還包括三星、海力士、美光,Astera Labs 和台灣的世邁科技(SMART Modular Technologies)等等;軟件層面主要是一些雲服務和軟件系統應用公司,比如 Elastics.cloud、英國 IntelliProp、以色列 UnifabriX 之類。
其中,三星電子是推動 CXL 技術應用的急先鋒。
2021 年 5 月 11 日,三星宣佈推出業界首款支持 CXL 互連標準的內存模塊(基於 128 GB DDR5)。這個模塊與三星 DDR5 技術實現集成後,能顯著擴展服務器系統的內存容量到 TB 級和帶寬,從而加速數據中心(IDC)的 AI 和高性能計算(HPC)的工作負載。
三星這款 CXL 內存模塊,還整合了多種控制器和軟件技術,如內存映射、接口轉換和錯誤管理,這將使 CPU 或 GPU 能夠識別基於 CXL 的內存並將之用作主內存。
此後,三星又發佈全球首款配備 512GB DDR5 DRAM 的 CXL 內存模塊,相比上一代,這款內存模塊的容量提升 4 倍,延遲減少 20%。
2023 年 5 月 12 日,三星宣佈成功開發業界首款支持 CXL 2.0 的 128 GB DRAM,支持 PCle 5.0 接口(x8 通道)並提供高達每秒 35GB 的帶寬。這款產品最終在英特爾至強平台上實現了里程碑式的進步。
與 HBM 相比,CXL 不但也解決帶寬問題,還同時搞定了容量擴展問題。就像堆疊(Chiplet)技術解決了在有限面積上的晶體管數量瓶頸。
總的來説,符合 CXL 技術的內存,具有高帶寬、低延遲和可擴展三大特性。因此,儘管 HBM 現在仍是主角,但未來無法擴展將成為其發展前景的制約。
事實上,SK 海力士與美光也看到了 CXL 的潛力,但這兩家公司在這項技術上的進度,與三星相比,尚有不足。與三星相比,海力士在 2023 年 9 月展示了首款 CXL 2.0 產品,落後三星約四個月,美光則比海力士早兩個月,但也同樣落後三星兩個月。
三星想通過 CXL 技術超越海力士,就目前看來,領先優勢較為微弱,究竟在這塊新市場,誰才是霸主,現在還很難説。

