--- title: "炸場的英偉達,把自己 “炸了”?" description: "英偉達市值飆升後出現下跌,分析師警告投資者踩剎車。芯片設計問題和客户變心導致英偉達面臨挑戰,服務器產品化節點的問題可能進一步影響英偉達的業績。分析師認為,頂級客户對英偉達的 GPU 產品支出的趨勢將會動搖,英偉達股價可能會出現兩位數的跌幅。此外,英偉達的 Blackwell 架構芯片存在負面傳聞,包括良率低、出貨延遲等問題。儘管問題已經被發現,但需要重新流片。" type: "news" locale: "zh-HK" url: "https://longbridge.com/zh-HK/news/210751422.md" published_at: "2024-08-05T10:47:20.000Z" --- # 炸場的英偉達,把自己 “炸了”? > 英偉達市值飆升後出現下跌,分析師警告投資者踩剎車。芯片設計問題和客户變心導致英偉達面臨挑戰,服務器產品化節點的問題可能進一步影響英偉達的業績。分析師認為,頂級客户對英偉達的 GPU 產品支出的趨勢將會動搖,英偉達股價可能會出現兩位數的跌幅。此外,英偉達的 Blackwell 架構芯片存在負面傳聞,包括良率低、出貨延遲等問題。儘管問題已經被發現,但需要重新流片。 騰訊科技,作者:Leslie Wu(前台積電建廠專家),編輯:蘇揚,題圖來自:視覺中國 英偉達市值飆升後出現下跌,分析師警告投資者踩剎車,原因涉及芯片設計問題和客户變心。 • 💥 英偉達市值飆升後出現下跌,分析師警告投資者踩剎車 • 🚨 芯片設計問題和客户變心導致英偉達面臨挑戰 • 💻 服務器產品化節點的問題可能進一步影響英偉達的業績 頻繁炸場的英偉達,沒能守住 3 萬億美元的市值。 北京時間 6 月 19 日,英偉達市值達到 3.335 萬億美元,一舉超過了微軟和蘋果成為全球第一。在經歷這一高光時刻之後,英偉達的市值開始走下坡路,截至 8 月 2 日收盤,英偉達的市值縮水 26%。 在此之前,已經有分析師呼籲投資者 “踩剎車”。每日經濟新聞援引投行 DA Davidson 分析師 Gil Luria 的觀點,稱英偉達業績創紀錄達到 260 億美元,源於頂級客户對其 GPU 產品的支出,他認為這種趨勢未來將會動搖,並且英偉達的股價在 18 個月內將出現兩位數的跌幅。 在 Gil Luria 這樣的分析師看來,頂級客户們已有 “二心”,而英偉達自身的 “失誤”,也給了客户變心和對手截胡的窗口期,**一切都要從 Blackwell 架構芯片的負面傳聞説起,包括 CoWoS 良率低、B100 SKU 被放棄、B200 出貨延遲及重新流片等關鍵議題**。 從台積電內部獲悉的情況來看,**英偉達 Blackwell 芯片重新流片的消息確有其事,但主要涉及 B100 系列基礎芯片,問題出在底層 Standard cell**(標準單元)——是預先設計好的標準特定功能、尺寸電路模塊,如果把芯片設計理解為搭積木,標準單元就是積木的最小單位——在高壓環境下會出現工況異常,目前問題都已經發現,需要重開掩膜版。 不過,整體晶圓製造 Wafer-in 到 Wafer-out 的時間沒辦法縮短,好在 2024 年只有小批量出貨,本身就不是 Blackwell 服務器的出貨時間,今年年底前擴大產能把小批量出貨的進度追回來,從我個人的從業經驗來看,這對於台積電來説不算難事。 一、替延遲出貨背鍋的良率 B100 被放棄、B200 延遲出貨重新流片屬於對 Blackwell 芯片 “跳票事故” 的片面理解,這與英偉達複雜的命名有關。 Blackwell 系列芯片包含 B100 和 B102 兩個基礎芯片,包括 B200\\GB200 在內的這些 SKU,都是採用基於 B100 系列的 Chiplet 方案,B200A 則是基於 B102 打造。 為了方便理解,給大家整理了一個表格,可以對照看 B102 和 B100 這個基礎芯片,以及對應的服務器 SKU,針對不同應用的服務器,還可以組合出更多款式,例如 HGX B200A / HGX B200/ NVL36/72 甚至是 NVL8 或 GB210A 的氣冷版本。 Blackwell 芯片的命名及各種 SKU 讓外界理解混亂,可以理解,**但 “CoWoS 良率只有 66%,一片晶圓只能切 10 顆 Good die” 這種説法則脱離了常識**。 我們可以從晶圓製造的前段和後段分別簡要説説 “良率” 這個概念。 前段的 GPU Die,和蘋果、高通以及 AMD 一樣,英偉達這次採用的是 N4P 工藝,已經非常成熟,所以良率根本不用擔心。 後段封裝,尤其是 CoWoS 的 “oS” 部分,不僅包含了 GPU die,也還有 HBM 內存,而且 8 顆 HBM 本身成本就很高,如果 GPU die 故障,整個封裝就成了廢片,**所以良率低於 80% 都不可能排產,不然成本會無限放大,毛利無法保障,如果是 66% 的水平,根本不會排產**。 在製造環節良率異常這種風險應對上,作為 Fabless 廠,不管是英偉達,還是蘋果,都不可能全部將產品押注在新方案上,如果新方案有問題,整代產品就可能報廢,這個風險太大,所以在下單時一定會有備選方案同時開案。換句話説,即便 CoWoS-L 的良率真出了問題,也不會影響 Blackwell 芯片的出貨。 我舉個例子,蘋果明年的 A18 芯片想採用台積電全新的 2nm 工藝,一定會同時開 N3P 工藝的方案,以確保 “賺無一失”,英偉達自然也會如此。 根據我們拿到的數據,Blackwell 採用 CoWoS-L 封裝,目前的良率在 90% 左右且還在爬升當中,這一點也和業內對 CoWoS 研究最透徹的野村團隊保持一致。另外,年初台積電對 CoWoS-L 良率的預期是 95%,相比 H200、H100 這些產品採用 CoWoS-S 封裝的 99% 的良率,90% 自然是表現不佳,但對於新工藝來説,勉強可以接受。 所以説,CoWoS-L 目前的良率確實不如預期,但前段的 GPU die 因為標準單元的問題,需重新設計掩膜,導致 Blackwell 芯片無法順利生產,間接導致後段的 CoWoS-L 產能出現停擺的現象,總結為 CoWoS-L 良率存在重大異常,來反推 Backwell 芯片不能順利出貨,有違事實,也有悖於行業常識。 實際上,在這次 B100 系列基礎芯片重新流片的問題之前,英偉達就已經出於 CoWoS-L 良率不及 95% 的問題進行了調整,在採用 B102 基礎芯片的 B200A 上,更換為 CoWoS-S 封裝,原計劃是分擔 CoWoS-L 的產能壓力,確保 2025 年有更多 Blackwell 芯片的產出,現在這種調整,也能夠幫助英偉達解決因為 GPU die 設計問題導致的進度延後問題,並且也能幫助拉高 2025 年 Blackwell 芯片的總體出貨量。 二、誰在掐着英偉達的 “脖子” 過去有很多討論,説英偉達卡着算力的脖子,但是英偉達自己的 “脖子” 卻被更上游的 HBM 內存這些企業卡着。 應該這樣説,目前 HBM、液冷 QCD 快接頭模塊供應都比較緊張,**但供應緊張並不會延遲出貨,頂多是導致出貨量減少**,而且現階段這些緊缺的零部件的工藝還是有保障的,比如三星,目前已經確定加入英偉達的 HBM 供應商體系當中。 **真正會影響 Blackwell 芯片發貨的,是後續各種服務器產品化的節點。** 從產業鏈的消息來看,目前進入生產階段的不止芯片,還有板卡組件、交換設備、機架、製冷方案等等。 而從 8 卡機櫃擴容到 72 卡機櫃,需要考慮包括網絡帶寬收斂、以及各種並行策略(模型數據切分、分段計算、拷貝和重組)在整個機櫃中的最佳工況等等諸多問題。此外,由於托盤變得更多,密度更高更緊湊,內部佈線數量、高速交換、散熱這些複雜的問題,都意味着機架也要重新設計,目前也應該都在測試當中。 由於 NVL36/72 服務器都是全新的技術方案,所有子系統與集成是否完善也是風險點之一,外界的關注點過去都集中在性能上,實際上整個系統的高成熟度與可靠度,也是考量這代產品好壞的依據。 對於採用水冷散熱的 GB200 系列,還要考慮漏液的問題,主要涉及三個部件:水冷板、分歧管、CDU 液冷分配單元以及 QCD 快接頭,其中快接頭最容易發生漏液,所以漏液也是服務器廠家最頭疼的問題,它的質量最為關鍵,直接牽涉到責任的歸屬劃分。一般情況下,如果出現漏液,英偉達會向客户先行賠付,然後再向鴻海、廣達這類系統廠進行索賠,一台 AI 服務器機架動輒數百萬美元,漏液賠償可能會讓一家小企業直接破產。 從我們拿到的消息來看,目前英偉達與鴻海、廣達這些系統廠還在進行水冷散熱的測試,還沒有大量導入。 前面説的,不管是芯片廠、系統廠還是散熱廠,面對動輒數百萬美元的賠償,沒有哪一家廠商願意輕易承擔這種風險,都需要實際導入後,有了 “小白鼠” 後才能大規模落地。 三、英偉達會 “翻車” 嗎? 文章開頭我們提到,英偉達的市值已經自歷史高點的 3.3 萬多億美元,下跌到現在的 2.6 萬億美元,跌幅超過 26%,而在一季報發佈的時候,英偉達自信地預期二季度營收 280 億美元,誤差在±2% 的區間內。 現在,由於 GPU die 的設計問題,CoWoS 封裝良率不及 95% 的預期,各種服務器技術方案還沒定案,都會影響 Blackwell 芯片的順利出貨,那麼這些問題是否會更進一步,將英偉達踢出 2 萬億市值的榜單? 可以這樣説,短期內不會有太大的問題,關鍵就在於,**Blackwell 芯片第三季度本身就是小批量排產,第四季度才會上量**,而且這只是台積電的排產節奏,完成 GPU die 的生產之後,接下來是後段 CoWoS,再接着就是 Bumping 廠,最後到工業富聯、緯創這些系統廠做組裝,進而完成服務器出貨和業績落地。 一句話説,服務器出貨才對英偉達的營收有影響,而不是台積電的芯片出貨。 按照現在的節奏,服務器的大批量交付最快也要到 2025 年的第一季度,換句話説,英偉達明年第一季度才會在 Blackwell 芯片上實現較大的業務增量。也就是説,這款芯片,到明年才會為英偉達貢獻大量的營收,這也是原來市場就有的合理預期,並不會反映在第二季度、甚至是第三季度的業績上。 對英偉達來説,在三季度發現設計上的問題,並且拿出解決方案,然後在台積電跑個 Super hot run(超級急件)對應的時間還是第四季度的中後期,大概在 11 月-12 月,本身這部分產能就已經預訂完成,3 個月基本可以繼續排產,且台積電不論 N4P 還是 CoWoS - S/L,產能都比現在充足 , 把稼動率拉到 120%,來應對因為設計缺陷導致原本第三季度要小批量出貨的芯片延遲出貨的問題 , 基本上沒有太大困難 , 也就是説,以年度來計算 , 今年 Blackwell 出貨雖然會少,但不會少很多。 對英偉達和整個產業鏈下游來説,芯片問題目前已暴露,服務器的各個子系統也必須同時進行各種實際環境的測試。比較樂觀的地方在於,目前生產出的芯片 , 只在特定高壓環境會有問題 ,這些芯片是可以交給鴻海等服務器系統廠家去做各種調適與測試,也就是服務器各子系統跟原本一樣,還是有半年時間拿到芯片去模擬各種環境的測試 ,最終大量的出貨時間點會落在 2025 年的 2-3 月份 。 從目前的情況看,第二季度在 H200 泄洪式出貨的背景下,業績大概率還是符合指引並超預期,而且本身 2023 年的營收主力是 H200 系列,前面提到,今年 Blackwell 芯片小批量出貨的規模會比原計劃有所減少,大概在 2 萬片晶圓(CoWoS-L 從 41K 減少到不足 20K),換算成英偉達業績預估在 80-95 億美元左右,但採取 H 系列增量銷售以及 B 系列回片後衝刺產能的緊急應對措施,這次業績損失大概會落在 50 億美元左右,這些可能會反映在第四季度財報當中,對股價的衝擊必定是有的,畢竟是產品翻車。 比起 Blackwell 芯片 “翻車” 這個事情本身,更值得思考和重視的一個問題在於,英偉達每年都會推出新的 SKU,需要許多創新技術,這個節奏非常之快,如果沒有足夠的時間去優化並提高可靠性,未來幾年在某一款產品上徹底翻車這個可能性也是有的,這是我們需要重新審視的英偉達的發展邏輯,也是競爭對手們苦苦等待的機會。 從更宏觀的角度來看,看盡管這兩年英偉達的增長邏輯沒有問題,但更長期的發展則是風險不斷加大。這種風險不僅僅表現為每一代瘋狂激進的技術更迭,還有應用端以及後續需求問題,簡單説就是大家耳熟能詳的 “AI 泡沫” ,又或者是否會出現新技術的強力競爭者,比如新的芯片技術或者掌握大模型的上游企業開始自研。 這兩天確實看到很多報道,關於中美巨頭們都紛紛下場自研,插播一個消息供參考,OpenAI 的自研芯片項目,已經和台積電談得差不多了。 騰訊科技,作者:Leslie Wu(前台積電建廠專家) ### Related Stocks - [SMH.US - 半導體 ETF - VanEck Vectors](https://longbridge.com/zh-HK/quote/SMH.US.md) - [SOXL.US - 半導體 3 倍做多 - Direxion](https://longbridge.com/zh-HK/quote/SOXL.US.md) - [NVDL.US - 2 倍做多英偉達 ETF - GraniteShares](https://longbridge.com/zh-HK/quote/NVDL.US.md) - [NVDA.US - 英偉達](https://longbridge.com/zh-HK/quote/NVDA.US.md) ## Related News & Research | Title | Description | URL | |-------|-------------|-----| | 机构 “最超配” 闪迪,“最低配” 英伟达 | 据摩根士丹利最新的统计:“机构对美国大型科技股的低配程度是 17 年来最大的” 相比 2025 年 Q4 的标普 500 指数权重,“$NVDA 仍然是机构低配程度最大的大型科技股,其次是苹果、微软、亚马逊和博通,而存储巨头闪迪则是 “最超 | [Link](https://longbridge.com/zh-HK/news/276289765.md) | | LPDDR 6 时代来临!AI 需求太猛,下一代 DRAM 将比预期更快进入市场 | LPDDR6 性能较前代提升 1.5 倍,最快下半年正式商用,英伟达、三星及高通等巨头正积极布局。目前多数 HPC 半导体设计企业考虑并行搭载 LPDDR5X 及 LPDDR6 IP,特别是在 4 纳米及以下先进制程芯片的设计中,需求出现得 | [Link](https://longbridge.com/zh-HK/news/276431575.md) | | 三星、海力士 “调整战略”:新存储工厂生产计划提前 | SK 海力士计划将其龙仁一期晶圆厂的试运行时间提前至明年 2-3 月,三星电子将平泽 P4 工厂的投产时间从明年一季度提前至今年四季度,生产规划前移约三个月。调整源于 AI 数据中心扩张导致供应严重短缺,主要客户需求满足率仅 60%。市场普 | [Link](https://longbridge.com/zh-HK/news/276302716.md) | | 为 AI 交易 “背书”!OpenAI 正敲定新一轮融资:以 8300 亿美元估值募资高达 1000 亿美元 | OpenAI 正以 8300 亿美元估值推进新一轮融资,目标筹集 1000 亿美元。软银拟领投 300 亿美元,亚马逊和英伟达可能各投 500 亿及 300 亿美元,微软拟投数十亿美元。本轮融资是 OpenAI 自去年秋季公司制改革以来的首 | [Link](https://longbridge.com/zh-HK/news/276298180.md) | | 黄仁勋预告 “前所未见” 的芯片新品,下一代 Feynman 架构或成焦点 | 黄仁勋预告今年的 GTC 大会上发布” 世界从未见过” 的全新芯片产品,分析认为新品可能涉及 Rubin 系列衍生产品或更具革命性的 Feynman 架构芯片,市场预期 Feynman 架构将针对推理场景进行深度优化。 | [Link](https://longbridge.com/zh-HK/news/276310964.md) | --- > **免責聲明**:本文內容僅供參考,不構成任何投資建議。