---
title: "成本暴降 70%！谷歌 TPU 强势追赶，性价比已追平英伟达"
type: "News"
locale: "zh-CN"
url: "https://longbridge.com/zh-CN/news/273174876.md"
description: "高盛表示，Google/Broadcom 的 TPU 正在迅速缩小与英伟达 GPU 在推理成本上的差距。从 TPU v6 升级至 TPU v7，单位代币推理成本下降约 70%，与英伟达 GB200 NVL72 基本持平。这并不意味着英伟达地位被动摇，但它清晰地表明，AI 芯片竞争核心评价体系正在从 “谁算得更快”，转向 “谁算得更便宜、更可持续”。"
datetime: "2026-01-21T04:54:21.000Z"
locales:
  - [zh-CN](https://longbridge.com/zh-CN/news/273174876.md)
  - [en](https://longbridge.com/en/news/273174876.md)
  - [zh-HK](https://longbridge.com/zh-HK/news/273174876.md)
---

# 成本暴降 70%！谷歌 TPU 强势追赶，性价比已追平英伟达

在 AI 资本开支仍维持高位、但商业化压力不断上升的当下，市场关注点正在发生一场悄然却深刻的转移：**大模型还能不能继续 “无视成本地跑下去”**。

据追风交易台，高盛最新发布的 AI 芯片研究报告，并未延续市场熟悉的 “算力、制程、参数规模” 对比，而是从更贴近商业现实的角度切入——**推理阶段的单位成本**。通过构建一条 “推理成本曲线”，高盛试图回答一个对 AI 产业至关重要的问题：在模型进入高频调用阶段后，不同芯片方案在折旧、能耗和系统利用率等约束下，**每处理一百万个 token 究竟需要付出多少真实成本**。

研究结论指向了一次正在加速、但尚未被充分消化的变化：**Google/Broadcom 的 TPU 正在迅速缩小与英伟达 GPU 在推理成本上的差距**。从 TPU v6 升级至 TPU v7，单位 token 推理成本下降约 70%，使其在绝对成本层面与英伟达 GB200 NVL72 基本持平，部分测算情形下甚至略具优势。

这并不意味着英伟达的地位被动摇，但它清晰地表明，**AI 芯片竞争的核心评价体系正在从 “谁算得更快”，转向 “谁算得更便宜、更可持续”**。当训练逐渐成为前期投入，而推理成为长期现金流来源，成本曲线的斜率，正在取代峰值算力，成为决定产业格局的关键变量。

## 一、从算力领先到成本效率，AI 芯片竞争的评价标准正在切换

在 AI 发展的早期阶段，训练算力几乎决定了一切。谁能更快训练出更大的模型，谁就拥有技术话语权。然而，随着大模型逐步进入部署与商业化阶段，推理负载开始远远超过训练本身，成本问题被迅速放大。

高盛指出，在这一阶段，芯片的性价比不再只由单卡性能决定，而是由系统层面的效率共同塑造，包括算力密度、互联效率、内存带宽以及能源消耗等多重因素。**基于这一逻辑构建的推理成本曲线显示，Google/Broadcom TPU 在原始计算性能和系统效率上的进步，已经足以在成本维度上与英伟达正面竞争。**

相比之下，AMD 和亚马逊 Trainium 在代际成本下降幅度上仍较为有限。从现阶段测算结果看，两者的单位推理成本仍明显高于英伟达和 Google 方案，对主流市场的冲击相对有限。

## 二、TPU 成本跃迁的背后，是系统工程能力而非单点突破

TPU v7 实现大幅降本，并非来自单一技术突破，而是**系统级优化能力的集中释放**。高盛认为，随着计算芯片本身逐步逼近物理极限，未来推理成本能否继续下降，将越来越依赖 “计算相邻技术” 的进步。

这些技术包括：更高带宽、更低延迟的网络互联；高带宽内存（HBM）和存储方案的持续集成；先进封装技术（如台积电 CoWoS）；以及机架级解决方案在密度与能效上的提升。**TPU 在这些方面的协同优化，使其在推理场景中展现出明显的经济性优势。**

这一趋势也与谷歌自身的算力部署高度一致。TPU 在 Google 内部工作负载中的使用比例持续上升，已广泛用于 Gemini 模型的训练与推理。同时，具备成熟软件能力的外部客户也在加速采用 TPU 方案，其中最引人注目的案例是 Anthropic 向 Broadcom 下达的约 210 亿美元订单，相关产品预计将在 2026 年中开始交付。

不过，高盛同时强调，**英伟达仍然掌握 “上市时间” 优势**。在 TPU v7 刚刚追平 GB200 NVL72 之际，英伟达已经推进至 GB300 NVL72，并计划在 2026 年下半年交付 VR200 NVL144。持续的产品迭代节奏，仍是其维持客户黏性的关键筹码。

## 三、投资含义再平衡：ASIC 崛起，但英伟达的护城河尚未被击穿

从投资视角看，高盛并未因 TPU 的快速追赶而下调对英伟达的判断。该机构仍维持对**英伟达与 Broadcom 的买入评级**，认为两者最直接绑定 AI 资本开支中最具可持续性的部分，并将长期受益于网络、封装和系统级技术升级。

在 ASIC 阵营中，Broadcom 的受益逻辑尤为清晰。高盛已将其 2026 财年每股收益预期上调至 10.87 美元，较市场一致预期高出约 6%，并认为市场仍低估了其在 AI 网络与定制计算领域的长期盈利能力。

AMD 和亚马逊 Trainium 当前仍处于追赶阶段，但高盛也指出，**AMD 的机架级方案存在后发优势的可能性**。预计在 2026 年末，基于 MI455X 的 Helios 机架方案有望在部分训练与推理场景中实现约 70% 的推理成本下降，值得持续跟踪。

更重要的是，这份研报给出的并非 “赢家通吃” 的结论，而是一幅逐渐清晰的产业分工图景：**GPU 继续主导训练与通用算力市场，而定制 ASIC 在规模化、可预测的推理负载中不断渗透**。在这一过程中，英伟达的 CUDA 生态与系统级研发投入仍构成坚实护城河，但其估值逻辑也将持续接受 “推理成本下行” 的现实检验。

当 AI 真正进入 “每一个 token 都要算回报” 的阶段，算力竞争终究要回到经济学本身。TPU 成本暴降 70%，并不是一次简单的技术追赶，而是一次对 AI 商业模式可行性的关键压力测试。而这，或许正是 GPU 与 ASIC 之争背后，市场最应认真对待的信号。

### 相关股票

- [NVDQ.US](https://longbridge.com/zh-CN/quote/NVDQ.US.md)
- [GOOG.US](https://longbridge.com/zh-CN/quote/GOOG.US.md)
- [NVDX.US](https://longbridge.com/zh-CN/quote/NVDX.US.md)
- [NVDS.US](https://longbridge.com/zh-CN/quote/NVDS.US.md)
- [GGLL.US](https://longbridge.com/zh-CN/quote/GGLL.US.md)
- [GOOGL.US](https://longbridge.com/zh-CN/quote/GOOGL.US.md)
- [NVDA.US](https://longbridge.com/zh-CN/quote/NVDA.US.md)
- [NVDL.US](https://longbridge.com/zh-CN/quote/NVDL.US.md)
- [07788.HK](https://longbridge.com/zh-CN/quote/07788.HK.md)
- [07388.HK](https://longbridge.com/zh-CN/quote/07388.HK.md)
- [NVDY.US](https://longbridge.com/zh-CN/quote/NVDY.US.md)
- [NVDD.US](https://longbridge.com/zh-CN/quote/NVDD.US.md)
- [SOXL.US](https://longbridge.com/zh-CN/quote/SOXL.US.md)

## 相关资讯与研究

- [中金：芯片及网络精益化再升级 继续看好光通信等核心投资方向](https://longbridge.com/zh-CN/news/285467112.md)
- [大行评级丨高盛：预期英伟达季度业绩将胜预期，重申 “买入” 评级及目标价 250 美元](https://longbridge.com/zh-CN/news/285656153.md)
- [谷歌调整垃圾邮件政策 以避免欧盟反垄断罚款](https://longbridge.com/zh-CN/news/285423126.md)
- [英伟达 “亲儿子” CoreWeave 今夜迎财报大考！暴涨 245% 后，市场开始担心三件事](https://longbridge.com/zh-CN/news/285553106.md)
- [英伟达将向数据中心公司 IREN 投资多达 21 亿美元](https://longbridge.com/zh-CN/news/285633245.md)