--- title: "Rubin 縮水背後,英偉達的 CUDA 神話正在鬆動" type: "News" locale: "zh-HK" url: "https://longbridge.com/zh-HK/news/291217629.md" description: "英偉達的產品迭代速度,正在撞上物理極限的牆。 更大的芯片→更復雜的封裝→更高的缺陷率→要麼延遲、要麼縮水。這是一條不能無限延伸的曲線。而與此同時,競爭對手們正在用另一種方式繞過這面牆:不做更大的芯片,做更專用的芯片。" datetime: "2026-06-30T03:05:40.000Z" locales: - [zh-CN](https://longbridge.com/zh-CN/news/291217629.md) - [en](https://longbridge.com/en/news/291217629.md) - [zh-HK](https://longbridge.com/zh-HK/news/291217629.md) --- # Rubin 縮水背後,英偉達的 CUDA 神話正在鬆動 兩條看似無關的新聞,在 6 月最後一週先後落地。 6 月 25 日,OpenAI 發佈首款自研 AI 推理芯片 Jalapeño,與博通聯手僅用 9 個月完成從設計到流片——這家全球最大的 GPU 買家,開始自己造芯片了。 6 月 30 日,半導體研究機構 SemiAnalysis 在社交平台公開宣佈:英偉達原版 4 芯片 Rubin Ultra 已在 GTC 2026 發佈僅三個月後遭取消,新版性能縮水近半。"這一切發生的背景是,"該機構補充道,"英偉達的市場份額正在被侵蝕。" 而早在去年,媒體爆出 Anthropic 的年化營收已逼近 70 億美元,旗下 Claude Code 在推出兩個月內創造了 5 億美元年化收入。而驅動這一切的算力底座,已經不再只有英偉達——谷歌 TPU 承擔訓練、亞馬遜 Trainium 負責推理、英偉達 GPU 退居為"研究探索"的第三選項。 **三條新聞,指向同一個問題:CUDA 護城河——英偉達最堅固也最被神話的競爭壁壘——正在出現裂痕。** ## 87% 到 75%,英偉達的"不可替代"正在瓦解 先看一組數字。 據 Silicon Analysts 基於英偉達/AMD 財報及台積電產能分配數據的估算,英偉達在 AI 加速器市場(按收入計)的份額軌跡如下: 可以看到, 英偉達的收入仍在增長——從 150 億到 1500 億,四年十倍。但份額從 87% 高峰滑向 75%,意味着增量市場中有越來越大的一塊被切走了。 **切走這塊蛋糕的,不是某一個對手,而是來自四面八方的競爭:谷歌 TPU、亞馬遜 Trainium、微軟 Maia、Meta MTIA、博通定製的 XPU——還有剛加入的 OpenAI。** 博通 CEO 陳福陽在 2026 財年一季報電話會上透露了一個此前未公開的數字:博通 AI 半導體收入已達到 84 億年化運行率,同比增長 10684 億年化運行率,同比增長 106400-500 億的年度軌跡衝刺。這家公司已經簽下了六個超大規模客户為其定製 AI 芯片,OpenAI 是第六個。 換句話説,全球最大的幾家雲計算公司和 AI 公司,不約而同地選擇了同一個方向:自己造芯片。 ## Anthropic 的選擇 如果説市場份額數據是冰冷的統計,那 Anthropic 的案例就是一個活生生的"去英偉達化"教科書。 Anthropic 是目前全球增長最快的 AI 公司之一。 年化營收逼近 70 億美元(2025 年同期僅約 10 億),服務超過 30 萬家企業客户,大客户數量同比增長近 7 倍。Claude Code 在推出兩個月內創造了 5 億美元年化收入,Anthropic 稱其為"史上增長最快的產品"。 而驅動這一切的算力底座,是一種被 Anthropic CFO Krishna Rao 稱為"獨特計算策略"的三平台架構: 注意最後一列。英偉達 GPU 排第三,不是並列,不是"備選",是三個選項裏規模最小的那個。 **這不是一個缺錢的小公司在用廉價替代品湊合。這是全球第二大 AI 公司,在生產環境中,用非英偉達芯片驅動其增長最快的產品。** SemiAnalysis 在 6 月 30 日的帖子中特別點出了這一點:"Claude Code 的推理工作有相當大一部分運行在 Trainium 上,Claude 的訓練在 TPU 上完成。就在一年前,TPU 和 Trainium 能增長到這種規模,同時 CUDA 護城河被緩慢侵蝕,還是難以想象的事。" Anthropic 為什麼要這樣做?不是因為 TPU 和 Trainium 比 H100 更強——在絕對性能上它們可能仍有差距。而是因為特定場景下,專有芯片的性價比遠超通用 GPU。訓練用 TPU,因為谷歌給了幾百億美元的合同和百萬顆芯片的供應承諾。推理用 Trainium,因為 AWS 是其主要雲服務商、已投資 80 億美元,Project Rainier 超算集羣完全跑在 Trainium 2 上,沒有 GPU 溢價。 亞馬遜在 Trainium 上賭得很大。據其 2026 年一季報披露,Trainium 產品線已獲得超過 2250 億美元的收入承諾,客户包括 OpenAI 和 Anthropic。AWS 的 AI 收入運行率已超過 150 億美元,Bedrock 推理服務大部分跑在 Trainium 上。 這裏的關鍵詞不是"性能",是"成本"。推理是每天都在燒錢的事。ChatGPT 每次回答問題、API 每次返回代碼,背後都是 GPU 在跑電。Anthropic 用 Trainium 替代 GPU 做推理,不是為了跑得更快,是為了每花一美元算更多次。 ## 三道侵蝕切口:CUDA 護城河從哪裏裂開 CUDA 之所以被視為英偉達最堅固的護城河,是因為它構建了一個"硬件 - 軟件 - 開發者"的封閉生態: - 20 年積累,400 萬 + 開發者 - 所有主流 ML 框架優先為 CUDA 優化 - cuDNN、TensorRT、NCCL 等優化庫形成深度綁定 - 切換成本以年計,以億美元衡量 但 2026 年的 AI 芯片競爭,不再是"做一個比 H100 快 10% 的 GPU"——那是正面進攻,無人能贏。侵蝕來自三個側面: **侵蝕路徑一:自研 ASIC——不打全戰場,只切最肥的推理蛋糕** 這是最致命的路徑。它的邏輯不是"我能做得比英偉達好",而是"我不需要 GPU 的所有功能,我只需要推理"。 一塊英偉達 H100 要做的事:圖形渲染、科學計算、AI 訓練、AI 推理、視頻編解碼……一塊 Jalapeño 只做一件事:運行 OpenAI 自己的模型進行推理。前者是瑞士軍刀,後者是一把專砍一種木頭的斧頭——在特定任務上,斧頭比軍刀好用得多,也便宜得多。 OpenAI Jalapeño 的定位極其精準: 不和英偉達比全能,只在推理——這個每天消耗數十億次 API 調用、每年燃燒數億美元成本的場景——做到極致。OpenAI 官方目標是降低 30-50% 的推理成本。在每天燒掉數百萬美元推理費用的體量下,這意味着每年節省數億美元的純利潤。 而且 OpenAI 不是第一家。 微軟 Maia 200(2026 年 1 月發佈)、谷歌 TPU Ironwood(第七代,首款專為推理設計)、亞馬遜 Trainium 3——四大雲廠商全部亮出了自研推理芯片。再加上 Meta MTIA 和蘋果的定製芯片,全球前七大科技公司中,只有一家還在"只買不造"——而它也在路上了。 **侵蝕路徑二:AMD——從"存在"到"可信替代"** AMD 的 AI GPU 收入從 2022 年的不到 10 億美元飆升至 2026 年預計的 150 億美元以上,四年超過 15 倍增長。 這背後的關鍵轉折點是 MI400 系列。基於 CDNA5 架構、432GB HBM4 內存、19.6 TB/s 帶寬,預計 2026 年下半年量產。S&P Global 預測 MI400 單系列將貢獻 72 億美元收入,佔 AMD 數據中心業務的 25%。 更重要的是客户端的信號。Meta 已與 AMD 簽署了高達 6 吉瓦的採購承諾——這不僅是 AMD 歷史上最大的 AI 芯片訂單,也是一個明確的信號:超大規模客户在做多供應商佈局。 AMD 的侷限同樣明顯:台積電 CoWoS 產能分配僅約 11%,而英偉達佔據 60% 以上。產能天花板決定了 AMD 短期內無法對英偉達形成數量級衝擊。但"可信的第二供應商"這個定位本身,就已經拆掉了"非英偉達不可"的敍事牆角。 **侵蝕路徑三:軟件層解耦——Triton、JAX 和"CUDA-Free"的未來** 這是最容易被忽略、但長期最危險的一條路徑。 CUDA 的綁定依賴於一個簡單事實:AI 研究員寫代碼用 PyTorch,PyTorch 底層跑在 CUDA 上。但如果 PyTorch 底層不再依賴 CUDA 呢? 這正在發生。 PyTorch 團隊已經驗證了使用 Triton 編譯器可以實現"CUDA-Free"推理——在 H100 和 A100 上運行 Llama 3 模型,Triton 內核生成的 token 吞吐量可與 CUDA 媲美。2026 年 2 月,Triton 推出了新的多後端支持,允許同一套代碼編譯到不同硬件上——AMD GPU、英特爾 GPU、甚至各種 ASIC。 谷歌的 JAX 框架走得更遠。它從一開始就設計為硬件無關——同樣的代碼可以在 TPU、GPU 甚至 CPU 上運行。Anthropic 選擇 TPU 進行訓練,很大程度上就是因為 JAX 讓它們可以在不重寫模型代碼的前提下遷移算力平台。 軟件層的解耦意味着什麼? 意味着新一代 AI 研究員可能在從未寫過一行 CUDA 代碼的情況下,訓練出最先進的模型。當開發者不再被鎖定在 CUDA 生態中,"必須買英偉達"的硬邏輯就變成了"可以買英偉達"的軟選擇。 ## Rubin Ultra 取消:物理極限的分水嶺 回到開篇的新聞。英偉達 4 芯片 Rubin Ultra 在發佈三個月後遭取消,被 SemiAnalysis 視為"製造執行層面的問題正在讓更多市場份額流失"。 技術原因並不複雜。原版 Rubin Ultra 計劃將 4 顆計算芯片 +16 個 HBM4E 內存模塊集成在單一封裝內,採用台積電 CoWoS-L 工藝。但據 Global Semi Research,4 芯片配置下出現了封裝基板翹曲——基板向多個方向彎曲,導致計算芯片無法與基板完全接觸。信號傳輸失效,芯片根本無法工作。 台積電的備選方案 CoPoS(面板級封裝)要到 2028 年底才能量產。英偉達等不起——所以新版 Rubin Ultra 回退到 2 芯片設計,性能縮水近半。 這件事的象徵意義大於實際業務影響。 英偉達仍然會賣掉它能生產的每一塊 Rubin Ultra。但"從 4 芯片回退到 2 芯片"暴露了一個更深層的問題:**英偉達的產品迭代速度,正在撞上物理極限的牆。 更大的芯片→更復雜的封裝→更高的缺陷率→要麼延遲、要麼縮水。這是一條不能無限延伸的曲線。** 而與此同時,競爭對手們正在用另一種方式繞過這面牆:不做更大的芯片,做更專用的芯片。 ## 定價權的裂縫 英偉達的護城河真正不可撼動的部分,不是 CUDA 軟件生態,是製造端。台積電 60% 的 CoWoS 先進封裝產能握在它手裏。這是物理壁壘,不是軟件壁壘。競爭對手可以寫出更好的框架、設計出更高效的 ASIC——但在出貨量上追趕英偉達,首先要過台積電產能這一關。 但問題也就在這裏:製造壁壘依賴的是一家第三方晶圓廠。它不是英偉達自己能控制的資產。 而英偉達 88% 的毛利率——H100 成本 3320 美元、售價 28000 美元——建立在一個前提上:客户無法離開它。 如果這個前提從"無法離開"變成"性價比最優的選擇",那定價權就不再是絕對的了。 Anthropic 證明了另一條路:不追求最好的芯片,追求最適合的芯片。訓練用 TPU 而不是 GPU,不是因為 TPU 更快,而是因為谷歌給了足夠多的芯片和足夠好的價格。推理用 Trainium 而不是 GPU,不是因為 Trainium 更強,而是因為 AWS 是戰略股東,Project Rainier 繞開了通用 GPU 的溢價。 當全球第二大 AI 公司把 GPU 降級為三大算力平台中最小的一塊時,"必須買英偉達"這件事就不再是鐵律了。 英偉達仍然是最好的。頭部 AI 公司沒有一個徹底離開了它——Anthropic 保留了一部分 GPU 用於"前沿研究探索",OpenAI 的 Jalapeño 只做推理不做訓練,Meta 的 MTIA 只覆蓋推薦系統和內容審核。 **但從"只有英偉達"到"英偉達最貴,先用便宜的",這中間的差距就是定價權的流失。** 市場已經開始為這個可能性重新定價。今年以來,SemiAnalysis 的每一次看空報告都引發相關板塊劇烈震動:6 月初 SOCAMM 削減消息導致美光單日跌 13%,6 月 10 日 CPO 延遲爭議迫使英偉達高管出面闢謠,6 月 30 日 Rubin Ultra 取消再度點燃討論。 這些波動的背後,是市場在艱難回答一個以前不需要回答的問題:如果 CUDA 不是不可替代的,英偉達值多少錢。 ### 相關股票 - [NVDA.US](https://longbridge.com/zh-HK/quote/NVDA.US.md) - [NVDL.US](https://longbridge.com/zh-HK/quote/NVDL.US.md) - [07388.HK](https://longbridge.com/zh-HK/quote/07388.HK.md) - [NVDS.US](https://longbridge.com/zh-HK/quote/NVDS.US.md) - [NVDY.US](https://longbridge.com/zh-HK/quote/NVDY.US.md) - [NVDD.US](https://longbridge.com/zh-HK/quote/NVDD.US.md) - [07788.HK](https://longbridge.com/zh-HK/quote/07788.HK.md) - [NVDQ.US](https://longbridge.com/zh-HK/quote/NVDQ.US.md) - [NVDX.US](https://longbridge.com/zh-HK/quote/NVDX.US.md) - [NVDU.US](https://longbridge.com/zh-HK/quote/NVDU.US.md) - [NVD.US](https://longbridge.com/zh-HK/quote/NVD.US.md) - [NVDB.US](https://longbridge.com/zh-HK/quote/NVDB.US.md) - [NVDG.US](https://longbridge.com/zh-HK/quote/NVDG.US.md) - [NVDO.US](https://longbridge.com/zh-HK/quote/NVDO.US.md) - [NVDW.US](https://longbridge.com/zh-HK/quote/NVDW.US.md) - [NVYY.US](https://longbridge.com/zh-HK/quote/NVYY.US.md) - [NYYY.US](https://longbridge.com/zh-HK/quote/NYYY.US.md) - [DIPS.US](https://longbridge.com/zh-HK/quote/DIPS.US.md) - [09388.HK](https://longbridge.com/zh-HK/quote/09388.HK.md) - [MAGX.US](https://longbridge.com/zh-HK/quote/MAGX.US.md) - [SMH.US](https://longbridge.com/zh-HK/quote/SMH.US.md) - [SOXX.US](https://longbridge.com/zh-HK/quote/SOXX.US.md) - [SOXL.US](https://longbridge.com/zh-HK/quote/SOXL.US.md) - [SOXQ.US](https://longbridge.com/zh-HK/quote/SOXQ.US.md) - [XSD.US](https://longbridge.com/zh-HK/quote/XSD.US.md) - [PSI.US](https://longbridge.com/zh-HK/quote/PSI.US.md) - [FTXL.US](https://longbridge.com/zh-HK/quote/FTXL.US.md) - [OpenAI.NA](https://longbridge.com/zh-HK/quote/OpenAI.NA.md) - [AVGO.US](https://longbridge.com/zh-HK/quote/AVGO.US.md) - [GOOGL.US](https://longbridge.com/zh-HK/quote/GOOGL.US.md) - [GOOG.US](https://longbridge.com/zh-HK/quote/GOOG.US.md) - [AMZN.US](https://longbridge.com/zh-HK/quote/AMZN.US.md) - [AMD.US](https://longbridge.com/zh-HK/quote/AMD.US.md) - [MSFT.US](https://longbridge.com/zh-HK/quote/MSFT.US.md) - [META.US](https://longbridge.com/zh-HK/quote/META.US.md) - [AAPL.US](https://longbridge.com/zh-HK/quote/AAPL.US.md) - [TSM.US](https://longbridge.com/zh-HK/quote/TSM.US.md) - [SPGI.US](https://longbridge.com/zh-HK/quote/SPGI.US.md) - [NVD.DE](https://longbridge.com/zh-HK/quote/NVD.DE.md) ## 相關資訊與研究 - [為何輝達沒有白吃的午餐?前員工揭黃仁勳「節儉」心法](https://longbridge.com/zh-HK/news/291286013.md) - [7 月起部分產品漲價 10%,這檔 IC 設計佈局 AI PC、Edge AI 與車用市場,打造長期成長曲線](https://longbridge.com/zh-HK/news/291301296.md) - [韓國稱力爭在李在明總統任期內建成新的芯片產業集羣](https://longbridge.com/zh-HK/news/291125227.md) - [全球儲存市場與半導體投資提升 AI 發展,韓日積極佈局科技競爭](https://longbridge.com/zh-HK/news/291244432.md) - [Alphabet 加入道瓊斯工業平均指數,股價上漲 3.7%](https://longbridge.com/zh-HK/news/291177120.md)