---
title: "SemiAnalysis：下游大模型公司已经爆赚，英伟达、台积电还能赚更多"
type: "News"
locale: "zh-CN"
url: "https://longbridge.com/zh-CN/news/284955261.md"
description: "AI 价值链正在经历结构性重估，芯片制造商面临下游模型厂商的快速追赶。SemiAnalysis 分析指出，Anthropic 年化收入在数月内从 90 亿美元升至逾 440 亿美元，推理毛利率从 38% 增至 70% 以上。英伟达和台积电的定价框架尚未反映市场变化，预计将有 40% 以上的上调空间。AI 价值洼地正在转移，基础设施层的利润将逐渐向模型层集中，预计 2025 年 AI 经济逻辑将被重写。"
datetime: "2026-05-02T04:13:51.000Z"
locales:
  - [zh-CN](https://longbridge.com/zh-CN/news/284955261.md)
  - [en](https://longbridge.com/en/news/284955261.md)
  - [zh-HK](https://longbridge.com/zh-HK/news/284955261.md)
---

# SemiAnalysis：下游大模型公司已经爆赚，英伟达、台积电还能赚更多

AI 价值链正在经历结构性重估。过去赚走大部分利润的芯片制造商正面临下游模型厂商的快速追赶，但上游的利润空间远未触及天花板。

SemiAnalysis 分析指出，Anthropic 年化收入在数月内从 90 亿美元升至逾 440 亿美元，推理毛利率从 38% 增至 70% 以上。英伟达目前的定价框架仍以成本为导向，尚未反映推理工作负载经济学的变化。一旦框架调整，英伟达系统定价具备 40% 以上的上调空间。台积电 N3 制程产能同样处于价值重分配的核心位置。

支撑此判断的关键在于供需两端的结构性错配：**N3 制程预计 2026 年下半年利用率将超过 100%，DRAM 工厂已逾 90% 满负荷运行，而前沿模型的 Token 需求仍在以复合速度扩张。**这一背景下，英伟达通过 SOCAMM 内存模块实现差异化定价的窗口已经打开。

## **AI 价值洼地转移：基础设施层让位于模型层**

**从 2023 年至 2025 年初，AI 价值链中的绝大部分利润积聚于基础设施层。**英伟达率先爆发，随后电力资产 Vistra 与 GE Vernova 分别在 2024 年上涨 265% 和 146%，存储厂商 SanDisk、Western Digital、Seagate 和 Micron 在 2025 年均实现逾 200% 涨幅。

这一格局的背面，是模型创建者与推理服务商长期承受的低毛利困境。彼时 AI 的实际使用价值有限，市场对 AI 投资回报的质疑声不断。

转折点出现在 2025 年 12 月。随着 Agentic AI（智能体 AI）真正走向实用，AI 的经济逻辑被彻底改写。SemiAnalysis 披露，其自身年化 Token 消耗支出已接近员工薪酬的 30%，每名员工每月消耗 Token 量接近 50 亿个，是 Meta 内部人均用量的 5 倍以上。大量原本需要初级分析师数小时完成的工作——包括财务建模、数据可视化、盈利分析——如今只需数美元的 Token 支出即可完成。

SemiAnalysis 估算，其团队在 Anthropic Claude 上的年化支出峰值已达 1095 万美元，而由此带来的竞争优势远超这一成本。Anthropic 随即受益：ARR 从 90 亿美元飙升至 440 亿美元以上，推理毛利率从 38% 升至超过 70%。

## **Token 成本骤降，模型厂商利润率扩张具有持续性**

**驱动模型厂商毛利率跃升的另一核心因素，是 Token 生产成本的大幅下降。**

从硬件维度看，在 8K 输入、1K 输出的标准推理任务上，经过完整软件优化（含宽 EP、计算与预取分离、多令牌预测）的 B300 系统每秒每 GPU 可产生约 14000 个 Token，而未优化版本仅约 1000 个——同款硬件上，软件优化单独贡献了 14 倍的吞吐量提升。若进一步叠加硬件升级，最优配置的 GB300 NVL72 相比 H100 的 FP8 吞吐量提升约 17 倍，切换至 H100 原生不支持的 FP4 精度后，差距扩大至 32 倍，而 GB300 每 GPU 总拥有成本仅高出约 70%。

从定价结构看，Agentic 工作负载具有极高的输入输出比（Claude Code 使用场景约为 300:1）与极高的缓存命中率（90% 以上），使得绝大多数 Token 落入最低计费档。SemiAnalysis 估算，Opus 4.7 在智能体任务上的真实混合成本约为每百万 Token0.99 美元，远低于标价的每百万输入 Token5 美元。

即便面对 Anthropic 对 Opus 系列的大幅降价——Opus 4.5 的定价较此前降低三分之二——SemiAnalysis 认为 Anthropic 的单位毛利实际上有所提升：**一方面，生产成本随硬件升级进一步下降；另一方面，用户大规模从 Sonnet 切换至 Opus，推高了混合 ASP。**

更具战略意义的是，Anthropic 在高端产品线上仍拥有定价主导权。Opus Fast 定价为常规 Opus 的 6 倍，而已宣布的 Mythos 定价为每百万 Token25 美元/125 美元，是常规 Opus 的 5 倍。SemiAnalysis 明确表示，若 Anthropic 愿意开放每百万 Token150 美元/750 美元的 Mythos Fast，其团队仍会购买——因为生产力提升的价值远超成本。

## **模型厂商的定价权为何难以被竞争侵蚀**

对于前沿模型高利润率是否可持续，最常见的质疑来自竞争压力。SemiAnalysis 给出了两个反驳理由。

其一，**前沿闭源模型与开源模型之间的能力差距依然显著，且短期内难以弥合。**以 Kimi K2.6（每百万 Token0.95 美元/4 美元）为代表的低价开源模型对 Opus 定价几乎不构成实质性压制。

其二，**算力约束意味着任何一家前沿实验室都无法独自服务整个市场。**Anthropic 已通过将 Claude Code 锁定在 100 美元以上月订阅门槛、限制第三方接入等方式主动管理需求侧。Token 需求在可预见的未来将持续超出供给，这意味着有能力提供真正前沿质量的实验室，可以按照 Token 所创造的经济价值而非竞争性成本来制定价格。

## **英伟达的定价克制：监管逻辑还是战略误判**

面对 AI 价值链的深刻重构，英伟达迄今未对其定价框架作出实质性调整，这是一个值得关注的结构性问题。

英伟达目前的定价仍主要以成本为锚，反映的是需求价值随时间递减的旧范式——而这一假设已不再成立。当前需求增长并非线性，而是以复合速度扩张，由智能体工作负载爆发与每个工作流程 Token 消耗量的持续跃升共同驱动。

SemiAnalysis 认为，英伟达保持定价克制，部分原因在于监管层面的顾虑。英伟达在 GPU、互联与软件栈上的主导地位已引发日益密切的反垄断关注。在下游 AI 实验室同样大幅盈利的背景下，激进提价可能加剧监管风险，也可能加速客户向 TPU、Trainium 等替代平台分散。

在此意义上，英伟达的行为模式与台积电颇为相似。台积电长期以来即便在满负荷运营、扮演先进制程供应瓶颈的情况下，也未将定价提升至稀缺溢价的极限，而是优先维护生态系统长期稳定与客户关系。**这一逻辑可概括为"AI 央行"——通过适度让利支撑下游生态扩张，而非最大化短期利润提取，以确保自身在 AI 时代的长期主导地位。**

然而，这一策略存在真实的机会成本。在算力需求持续超过供给的结构性背景下，掌握稀缺资源却未充分定价，相当于将价值拱手相让给生态链中游和下游。台积电在 N3 制程上同样如此——SemiAnalysis 直接指出这是"战略失误"，至少应要求更大规模的预付款安排。

## **Rubin 定价空间：SOCAMM 成为利润新杠杆**

**英伟达即将推出的 Vera Rubin VR NVL72 系统，提供了一个重新评估定价框架的契机。**

从成本角度看，据测算，VR NVL72 实现与 GB300 NVL72 相同的 15.6% 项目 IRR（5 年期，15% 预付款）所需的最低 GPU 租金约为每小时 4.92 美元。从价值角度看，若以 FP8 密集算力维度锚定当前 GB300 每 PFLOP 租金约 0.70 美元，VR NVL72 对应的理论最高定价约为每 GPU 每小时 12.25 美元，是成本地板价的约 2.5 倍。

这一巨大价差表明，英伟达在 VR NVL72 定价上拥有充足的上调空间。SemiAnalysis 估算，若英伟达将系统定价提升约 40%，仍可为 Neocloud 保留足够的利润空间——即便 Neocloud 将租金提价至每小时 8 美元以上，对应每 PFLOP 成本仍低于历史趋势线。

在具体机制上，**SOCAMM 成为最关键的定价杠杆。**不同于 GB300 将 LPDDR5X 内存直接焊接于主板、嵌入整体系统定价，VR NVL72 采用可插拔的 SOCAMM 模块，允许英伟达将内存作为独立计费项目单独列示和定价。

SOCAMM（Small Outline Compression Attached Memory Module，小型化压缩附加内存模组）是英伟达主导、联合三星、SK 海力士和美光等内存厂商开发的新型模块化内存标准，基于 LPDDR5X（或未来 LPDDR6）DRAM 技术，面向 AI 服务器与个人 AI 超级计算机场景。

模型显示，英伟达在 2026 年第一季度支付的 SOCAMM 合同价格约为每 GB 8 美元，较上季度大幅提升，主要反映 LPDDR5X 供应紧张与整体 DRAM 价格上行。基于对 2026 年底移动 DRAM 定价的预测，2026 年底 SOCAMM 定价或超过每 GB 13 美元，全年均值约 10 美元为合理假设。

在此基础上，SemiAnalysis 认为英伟达在 SOCAMM 上收取 60% 毛利率具有合理性：**一是内存供应全面紧张，英伟达在 SOCAMM 采购上具有优先获取权；二是 VR NVL72 在性能/TCO 维度远超同期竞品，客户缺乏可替代选项；三是英伟达本身已面临 SOCAMM 采购成本的大幅上涨，向下游传导具有合理依据。**

此外，内存定价不像 GPU 定价那样面临反垄断顾虑，这给了英伟达更大的差异化定价空间——包括对 Neocloud 与超大规模云厂商实施差别定价。目前，英伟达在网络设备上已对 Neocloud 收取约为超大规模云厂商两倍的价格，同样的逻辑完全可以延伸至内存层面。

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

### 相关股票

- [TSM.US](https://longbridge.com/zh-CN/quote/TSM.US.md)
- [NVDA.US](https://longbridge.com/zh-CN/quote/NVDA.US.md)
- [SOXL.US](https://longbridge.com/zh-CN/quote/SOXL.US.md)
- [NVD.US](https://longbridge.com/zh-CN/quote/NVD.US.md)
- [NVDS.US](https://longbridge.com/zh-CN/quote/NVDS.US.md)
- [TSMG.US](https://longbridge.com/zh-CN/quote/TSMG.US.md)
- [TSMU.US](https://longbridge.com/zh-CN/quote/TSMU.US.md)
- [SOXX.US](https://longbridge.com/zh-CN/quote/SOXX.US.md)
- [NVDL.US](https://longbridge.com/zh-CN/quote/NVDL.US.md)
- [NVDD.US](https://longbridge.com/zh-CN/quote/NVDD.US.md)
- [TSMX.US](https://longbridge.com/zh-CN/quote/TSMX.US.md)
- [NVDX.US](https://longbridge.com/zh-CN/quote/NVDX.US.md)
- [SMH.US](https://longbridge.com/zh-CN/quote/SMH.US.md)
- [NVDY.US](https://longbridge.com/zh-CN/quote/NVDY.US.md)
- [NVDQ.US](https://longbridge.com/zh-CN/quote/NVDQ.US.md)
- [NVDU.US](https://longbridge.com/zh-CN/quote/NVDU.US.md)
- [XSD.US](https://longbridge.com/zh-CN/quote/XSD.US.md)
- [PSI.US](https://longbridge.com/zh-CN/quote/PSI.US.md)
- [07788.HK](https://longbridge.com/zh-CN/quote/07788.HK.md)
- [07388.HK](https://longbridge.com/zh-CN/quote/07388.HK.md)

## 相关资讯与研究

- [募资规模翻倍！传 AI 芯片新贵 CerebrasIPO 加码至 40 亿美元 最快下周开启路演](https://longbridge.com/zh-CN/news/284954172.md)
- [Anthropic 拟扩大 Mythos 模型访问权限，美国政府反对](https://longbridge.com/zh-CN/news/284792459.md)
- [银河通用拉着英伟达，把人形机器人最大的谎言拆穿了](https://longbridge.com/zh-CN/news/284728712.md)
- [AI 芯片制造商 Cerebras 的 IPO 目标融资 40 亿美元，估值约 400 亿](https://longbridge.com/zh-CN/news/284954747.md)
- [DeepSeek，整整落后了 8 个月…](https://longbridge.com/zh-CN/news/284960439.md)