
英偉達王朝的 “軟肋”:GPU 的三大風險

首創證券認為,英偉達正面臨三大風險:AI 競賽放緩、三星投資 GPU、算法技術突變。這些風險可能動搖其市值龍頭地位,對整個 GPU 行業造成影響。
6 月 18 日全球 GPU 龍頭英偉達成為全球市值最大的公司
2024 年 6 月 18 日美股收盤,英偉達市值達到 3.33 萬億美元,超過微軟、蘋果、谷歌、亞馬遜成為全球市值最大的公司。
人工智能對 GPU 算力需求,是 GPU 的最大推動力
以英偉達為例,足見算力對 GPU 的拉動力。2024 年 Q1 收入佔比高達 86.6% 的數據中心業務,收入增長 426% 達到 225 億美元。而在 2016 年英偉達的數據中心業務收入佔比僅有 6.77%。
拐點一:AI 競賽放緩,大模型創業公司倒閉退出
5 月 6 日幻方的深度求索率先發起價格戰,後續阿里、百度、騰訊、字節等旗下大模型跟進。目前大模型的主流應用還停留在問答模式,降價的背景是盈利模式無法很好落地,只能通過 tokens 收費。大模型創業公司若不改變無法盈利或看不到盈利預期的燒錢模式,未來就會有現金流中斷的風險,大批量創業公司退出將會減少對 GPU 需求。
拐點二:三星投資 GPU,新競爭者加入拉低行業利潤率
行業龍頭英偉達 24Q1 毛利率高達 78.35%,淨利潤率 57%,高利潤率容易吸引更多的競爭者加入。三星公開宣佈投資 GPU,預示着與 GPU 行業巨頭英偉達正面競爭。與谷歌等互聯網大廠以 fabless 模式做 GPU 不同,三星做 GPU 有經驗與技術積累:1.三星的半導體業務是 IDM 模式,設計與工藝緊密融合。2.三星擁有 Exynos 等處理器的成功經驗,為 GPU 提供算力芯片設計參考。3.三星具有與 GPU 配套的高帶寬內存芯片(HBM),可以從系統層面提升芯片算力組的能力。
拐點三:算法層的突變,從矩陣計算到無矩陣計算
通過算法的改進,減少對 GPU 的消耗,是技術層面的重大風險。前面兩大風險都是中短期對 GPU 公司業績的影響,是在原有的技術框架下的競爭。而算法技術層面的突變是較大的變革,如同從燃油車到電動車,對汽油的需求直接清零。矩陣乘法(MatMul)是 Transformer 大語言模型(LLM)中最耗費計算資源的運算,矩陣乘法佔用了高昂的計算成本和龐大的內存需求。2024 年 6 月 18 日 arXiv 的論文《ScalableMatMul-freeLanguageModeling》(第五版)中的新 Transformer 架構通過無矩陣乘法(MatMul-free),顯著減少對 GPU 和內存依賴,並且使用 FPGA 方案替代 GPU 進行訓練和推理,以 13 瓦特的功耗處理數十億參數模型,已接近人腦效率。
本文作者:何立中(SAC 執證編號:S0110522110002),來源:首創證券,原文標題:《GPU 的拐點》

