
英伟达王朝的 “软肋”:GPU 的三大风险

首创证券认为,英伟达正面临三大风险:AI 竞赛放缓、三星投资 GPU、算法技术突变。这些风险可能动摇其市值龙头地位,对整个 GPU 行业造成影响。
6 月 18 日全球 GPU 龙头英伟达成为全球市值最大的公司
2024 年 6 月 18 日美股收盘,英伟达市值达到 3.33 万亿美元,超过微软、苹果、谷歌、亚马逊成为全球市值最大的公司。
人工智能对 GPU 算力需求,是 GPU 的最大推动力
以英伟达为例,足见算力对 GPU 的拉动力。2024 年 Q1 收入占比高达 86.6% 的数据中心业务,收入增长 426% 达到 225 亿美元。而在 2016 年英伟达的数据中心业务收入占比仅有 6.77%。
拐点一:AI 竞赛放缓,大模型创业公司倒闭退出
5 月 6 日幻方的深度求索率先发起价格战,后续阿里、百度、腾讯、字节等旗下大模型跟进。目前大模型的主流应用还停留在问答模式,降价的背景是盈利模式无法很好落地,只能通过 tokens 收费。大模型创业公司若不改变无法盈利或看不到盈利预期的烧钱模式,未来就会有现金流中断的风险,大批量创业公司退出将会减少对 GPU 需求。
拐点二:三星投资 GPU,新竞争者加入拉低行业利润率
行业龙头英伟达 24Q1 毛利率高达 78.35%,净利润率 57%,高利润率容易吸引更多的竞争者加入。三星公开宣布投资 GPU,预示着与 GPU 行业巨头英伟达正面竞争。与谷歌等互联网大厂以 fabless 模式做 GPU 不同,三星做 GPU 有经验与技术积累:1.三星的半导体业务是 IDM 模式,设计与工艺紧密融合。2.三星拥有 Exynos 等处理器的成功经验,为 GPU 提供算力芯片设计参考。3.三星具有与 GPU 配套的高带宽内存芯片(HBM),可以从系统层面提升芯片算力组的能力。
拐点三:算法层的突变,从矩阵计算到无矩阵计算
通过算法的改进,减少对 GPU 的消耗,是技术层面的重大风险。前面两大风险都是中短期对 GPU 公司业绩的影响,是在原有的技术框架下的竞争。而算法技术层面的突变是较大的变革,如同从燃油车到电动车,对汽油的需求直接清零。矩阵乘法(MatMul)是 Transformer 大语言模型(LLM)中最耗费计算资源的运算,矩阵乘法占用了高昂的计算成本和庞大的内存需求。2024 年 6 月 18 日 arXiv 的论文《ScalableMatMul-freeLanguageModeling》(第五版)中的新 Transformer 架构通过无矩阵乘法(MatMul-free),显著减少对 GPU 和内存依赖,并且使用 FPGA 方案替代 GPU 进行训练和推理,以 13 瓦特的功耗处理数十亿参数模型,已接近人脑效率。
本文作者:何立中(SAC 执证编号:S0110522110002),来源:首创证券,原文标题:《GPU 的拐点》

