--- title: "SemiAnalysis:下游大模型公司已经爆赚,英伟达、台积电还能赚更多" type: "News" locale: "zh-CN" url: "https://longbridge.com/zh-CN/news/284955261.md" description: "AI 价值链正在经历结构性重估,芯片制造商面临下游模型厂商的快速追赶。SemiAnalysis 分析指出,Anthropic 年化收入在数月内从 90 亿美元升至逾 440 亿美元,推理毛利率从 38% 增至 70% 以上。英伟达和台积电的定价框架尚未反映市场变化,预计将有 40% 以上的上调空间。AI 价值洼地正在转移,基础设施层的利润将逐渐向模型层集中,预计 2025 年 AI 经济逻辑将被重写。" datetime: "2026-05-02T04:13:51.000Z" locales: - [zh-CN](https://longbridge.com/zh-CN/news/284955261.md) - [en](https://longbridge.com/en/news/284955261.md) - [zh-HK](https://longbridge.com/zh-HK/news/284955261.md) --- # SemiAnalysis:下游大模型公司已经爆赚,英伟达、台积电还能赚更多 AI 价值链正在经历结构性重估。过去赚走大部分利润的芯片制造商正面临下游模型厂商的快速追赶,但上游的利润空间远未触及天花板。 SemiAnalysis 分析指出,Anthropic 年化收入在数月内从 90 亿美元升至逾 440 亿美元,推理毛利率从 38% 增至 70% 以上。英伟达目前的定价框架仍以成本为导向,尚未反映推理工作负载经济学的变化。一旦框架调整,英伟达系统定价具备 40% 以上的上调空间。台积电 N3 制程产能同样处于价值重分配的核心位置。 支撑此判断的关键在于供需两端的结构性错配:**N3 制程预计 2026 年下半年利用率将超过 100%,DRAM 工厂已逾 90% 满负荷运行,而前沿模型的 Token 需求仍在以复合速度扩张。**这一背景下,英伟达通过 SOCAMM 内存模块实现差异化定价的窗口已经打开。 ## **AI 价值洼地转移:基础设施层让位于模型层** **从 2023 年至 2025 年初,AI 价值链中的绝大部分利润积聚于基础设施层。**英伟达率先爆发,随后电力资产 Vistra 与 GE Vernova 分别在 2024 年上涨 265% 和 146%,存储厂商 SanDisk、Western Digital、Seagate 和 Micron 在 2025 年均实现逾 200% 涨幅。 这一格局的背面,是模型创建者与推理服务商长期承受的低毛利困境。彼时 AI 的实际使用价值有限,市场对 AI 投资回报的质疑声不断。 转折点出现在 2025 年 12 月。随着 Agentic AI(智能体 AI)真正走向实用,AI 的经济逻辑被彻底改写。SemiAnalysis 披露,其自身年化 Token 消耗支出已接近员工薪酬的 30%,每名员工每月消耗 Token 量接近 50 亿个,是 Meta 内部人均用量的 5 倍以上。大量原本需要初级分析师数小时完成的工作——包括财务建模、数据可视化、盈利分析——如今只需数美元的 Token 支出即可完成。 SemiAnalysis 估算,其团队在 Anthropic Claude 上的年化支出峰值已达 1095 万美元,而由此带来的竞争优势远超这一成本。Anthropic 随即受益:ARR 从 90 亿美元飙升至 440 亿美元以上,推理毛利率从 38% 升至超过 70%。 ## **Token 成本骤降,模型厂商利润率扩张具有持续性** **驱动模型厂商毛利率跃升的另一核心因素,是 Token 生产成本的大幅下降。** 从硬件维度看,在 8K 输入、1K 输出的标准推理任务上,经过完整软件优化(含宽 EP、计算与预取分离、多令牌预测)的 B300 系统每秒每 GPU 可产生约 14000 个 Token,而未优化版本仅约 1000 个——同款硬件上,软件优化单独贡献了 14 倍的吞吐量提升。若进一步叠加硬件升级,最优配置的 GB300 NVL72 相比 H100 的 FP8 吞吐量提升约 17 倍,切换至 H100 原生不支持的 FP4 精度后,差距扩大至 32 倍,而 GB300 每 GPU 总拥有成本仅高出约 70%。 从定价结构看,Agentic 工作负载具有极高的输入输出比(Claude Code 使用场景约为 300:1)与极高的缓存命中率(90% 以上),使得绝大多数 Token 落入最低计费档。SemiAnalysis 估算,Opus 4.7 在智能体任务上的真实混合成本约为每百万 Token0.99 美元,远低于标价的每百万输入 Token5 美元。 即便面对 Anthropic 对 Opus 系列的大幅降价——Opus 4.5 的定价较此前降低三分之二——SemiAnalysis 认为 Anthropic 的单位毛利实际上有所提升:**一方面,生产成本随硬件升级进一步下降;另一方面,用户大规模从 Sonnet 切换至 Opus,推高了混合 ASP。** 更具战略意义的是,Anthropic 在高端产品线上仍拥有定价主导权。Opus Fast 定价为常规 Opus 的 6 倍,而已宣布的 Mythos 定价为每百万 Token25 美元/125 美元,是常规 Opus 的 5 倍。SemiAnalysis 明确表示,若 Anthropic 愿意开放每百万 Token150 美元/750 美元的 Mythos Fast,其团队仍会购买——因为生产力提升的价值远超成本。 ## **模型厂商的定价权为何难以被竞争侵蚀** 对于前沿模型高利润率是否可持续,最常见的质疑来自竞争压力。SemiAnalysis 给出了两个反驳理由。 其一,**前沿闭源模型与开源模型之间的能力差距依然显著,且短期内难以弥合。**以 Kimi K2.6(每百万 Token0.95 美元/4 美元)为代表的低价开源模型对 Opus 定价几乎不构成实质性压制。 其二,**算力约束意味着任何一家前沿实验室都无法独自服务整个市场。**Anthropic 已通过将 Claude Code 锁定在 100 美元以上月订阅门槛、限制第三方接入等方式主动管理需求侧。Token 需求在可预见的未来将持续超出供给,这意味着有能力提供真正前沿质量的实验室,可以按照 Token 所创造的经济价值而非竞争性成本来制定价格。 ## **英伟达的定价克制:监管逻辑还是战略误判** 面对 AI 价值链的深刻重构,英伟达迄今未对其定价框架作出实质性调整,这是一个值得关注的结构性问题。 英伟达目前的定价仍主要以成本为锚,反映的是需求价值随时间递减的旧范式——而这一假设已不再成立。当前需求增长并非线性,而是以复合速度扩张,由智能体工作负载爆发与每个工作流程 Token 消耗量的持续跃升共同驱动。 SemiAnalysis 认为,英伟达保持定价克制,部分原因在于监管层面的顾虑。英伟达在 GPU、互联与软件栈上的主导地位已引发日益密切的反垄断关注。在下游 AI 实验室同样大幅盈利的背景下,激进提价可能加剧监管风险,也可能加速客户向 TPU、Trainium 等替代平台分散。 在此意义上,英伟达的行为模式与台积电颇为相似。台积电长期以来即便在满负荷运营、扮演先进制程供应瓶颈的情况下,也未将定价提升至稀缺溢价的极限,而是优先维护生态系统长期稳定与客户关系。**这一逻辑可概括为"AI 央行"——通过适度让利支撑下游生态扩张,而非最大化短期利润提取,以确保自身在 AI 时代的长期主导地位。** 然而,这一策略存在真实的机会成本。在算力需求持续超过供给的结构性背景下,掌握稀缺资源却未充分定价,相当于将价值拱手相让给生态链中游和下游。台积电在 N3 制程上同样如此——SemiAnalysis 直接指出这是"战略失误",至少应要求更大规模的预付款安排。 ## **Rubin 定价空间:SOCAMM 成为利润新杠杆** **英伟达即将推出的 Vera Rubin VR NVL72 系统,提供了一个重新评估定价框架的契机。** 从成本角度看,据测算,VR NVL72 实现与 GB300 NVL72 相同的 15.6% 项目 IRR(5 年期,15% 预付款)所需的最低 GPU 租金约为每小时 4.92 美元。从价值角度看,若以 FP8 密集算力维度锚定当前 GB300 每 PFLOP 租金约 0.70 美元,VR NVL72 对应的理论最高定价约为每 GPU 每小时 12.25 美元,是成本地板价的约 2.5 倍。 这一巨大价差表明,英伟达在 VR NVL72 定价上拥有充足的上调空间。SemiAnalysis 估算,若英伟达将系统定价提升约 40%,仍可为 Neocloud 保留足够的利润空间——即便 Neocloud 将租金提价至每小时 8 美元以上,对应每 PFLOP 成本仍低于历史趋势线。 在具体机制上,**SOCAMM 成为最关键的定价杠杆。**不同于 GB300 将 LPDDR5X 内存直接焊接于主板、嵌入整体系统定价,VR NVL72 采用可插拔的 SOCAMM 模块,允许英伟达将内存作为独立计费项目单独列示和定价。 SOCAMM(Small Outline Compression Attached Memory Module,小型化压缩附加内存模组)是英伟达主导、联合三星、SK 海力士和美光等内存厂商开发的新型模块化内存标准,基于 LPDDR5X(或未来 LPDDR6)DRAM 技术,面向 AI 服务器与个人 AI 超级计算机场景。 模型显示,英伟达在 2026 年第一季度支付的 SOCAMM 合同价格约为每 GB 8 美元,较上季度大幅提升,主要反映 LPDDR5X 供应紧张与整体 DRAM 价格上行。基于对 2026 年底移动 DRAM 定价的预测,2026 年底 SOCAMM 定价或超过每 GB 13 美元,全年均值约 10 美元为合理假设。 在此基础上,SemiAnalysis 认为英伟达在 SOCAMM 上收取 60% 毛利率具有合理性:**一是内存供应全面紧张,英伟达在 SOCAMM 采购上具有优先获取权;二是 VR NVL72 在性能/TCO 维度远超同期竞品,客户缺乏可替代选项;三是英伟达本身已面临 SOCAMM 采购成本的大幅上涨,向下游传导具有合理依据。** 此外,内存定价不像 GPU 定价那样面临反垄断顾虑,这给了英伟达更大的差异化定价空间——包括对 Neocloud 与超大规模云厂商实施差别定价。目前,英伟达在网络设备上已对 Neocloud 收取约为超大规模云厂商两倍的价格,同样的逻辑完全可以延伸至内存层面。 风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。 ### 相关股票 - [TSM.US](https://longbridge.com/zh-CN/quote/TSM.US.md) - [NVDA.US](https://longbridge.com/zh-CN/quote/NVDA.US.md) - [SOXL.US](https://longbridge.com/zh-CN/quote/SOXL.US.md) - [NVD.US](https://longbridge.com/zh-CN/quote/NVD.US.md) - [NVDS.US](https://longbridge.com/zh-CN/quote/NVDS.US.md) - [TSMG.US](https://longbridge.com/zh-CN/quote/TSMG.US.md) - [TSMU.US](https://longbridge.com/zh-CN/quote/TSMU.US.md) - [SOXX.US](https://longbridge.com/zh-CN/quote/SOXX.US.md) - [NVDL.US](https://longbridge.com/zh-CN/quote/NVDL.US.md) - [NVDD.US](https://longbridge.com/zh-CN/quote/NVDD.US.md) - [TSMX.US](https://longbridge.com/zh-CN/quote/TSMX.US.md) - [NVDX.US](https://longbridge.com/zh-CN/quote/NVDX.US.md) - [SMH.US](https://longbridge.com/zh-CN/quote/SMH.US.md) - [NVDY.US](https://longbridge.com/zh-CN/quote/NVDY.US.md) - [NVDQ.US](https://longbridge.com/zh-CN/quote/NVDQ.US.md) - [NVDU.US](https://longbridge.com/zh-CN/quote/NVDU.US.md) - [XSD.US](https://longbridge.com/zh-CN/quote/XSD.US.md) - [PSI.US](https://longbridge.com/zh-CN/quote/PSI.US.md) - [07788.HK](https://longbridge.com/zh-CN/quote/07788.HK.md) - [07388.HK](https://longbridge.com/zh-CN/quote/07388.HK.md) ## 相关资讯与研究 - [银河通用拉着英伟达,把人形机器人最大的谎言拆穿了](https://longbridge.com/zh-CN/news/284728712.md) - [辉达 B300 伺服器内地售价升至 700 万人民币](https://longbridge.com/zh-CN/news/284741630.md) - [AI 芯片制造商 Cerebras 的 IPO 目标融资 40 亿美元,估值约 400 亿](https://longbridge.com/zh-CN/news/284954747.md) - [募资规模翻倍!传 AI 芯片新贵 CerebrasIPO 加码至 40 亿美元 最快下周开启路演](https://longbridge.com/zh-CN/news/284954172.md) - [Anthropic 拟扩大 Mythos 模型访问权限,美国政府反对](https://longbridge.com/zh-CN/news/284792459.md)