英偉達 Blackwell 推進順利,台積電繼續受益

portai
我是 PortAI,我可以總結文章信息。

近期,有消息稱,8 月份的時候,針對新產品 Blackwell,英偉達修改了光罩(mask),進了一次新的 super hot run,聽過 10 月中旬可能出流片結果。目前流片進展順利。

不過行業專家認為,最終還需要大量跑量來進行批量測試,得到統計數據,再來確定良率是否合格,可能下個階段就進行。目前看,光罩改良後,設計層面電路、線路改良後效果目測較好。

之前上次 Blackwell 的問題,可能不僅僅是光罩,bridge die 設計在兩個晶片 top 上這部分也有不順利的情況,因此英偉達也和 TSMC 團隊一起工作看如何解決和改善,以讓 2 個晶片中間的 top 更加順利,減少頻寬問題。

關於 warpage,應該得到一致,也選定了 TC 機器,可能是 K&S,大約 18 台,用於 CoWoS-L 的 Fluxless 製程,其 TC Fluxless 目前聽説已經 qualified,所以應該不是 ASM。

另外,(台積電)先進封裝 CoWoS wafer 的期望值預計在明年 Q3~Q4 翻倍,屆時單 CoWoS-L 可能就達到每季度 10 萬片。

目前 CoWoS wafer 約 300k/年,明年可能翻倍至 600K~700K(其中 600K 的數字還未包含台積電所購買的羣創南科四廠,進行玻璃基板的先進封裝)。

該數字建立在目前的預期進度上,但台積電也擔心,目前能見度只能看到 2025 年上半年,大約 7 月之前,而對於下半年情況台積電也並不清楚,具體量會擴產到何種程度。

還需看英偉達和 AMD。AMD 相對還比較樂觀,架構也在修改。

目前一些可以確定的是,AI 之後的 CPO 會是一個主戰場,AMD 和英偉達目前也在設計其自己的 CPO,目前銅線支撐的電流快到極限,因此可能要儘快上 CPO,目前各家都有自己的 CPO 設計,也在和台積電去 work 這件事,例如台積電説的 SoW(System on Wafer)這種新架構,是用 Silicon Photonics 去做。另外,DIE 會走 MCM,也一定會走 chiplet。

AMD 目前比較樂觀,主要基於其緊密地跟蹤客户庫存,他們一直在拜訪頭部 CSP 客户,諮詢庫存情況。但目前得到的回覆似乎不夠多,因此 AMD 也會擔心這是否會影響後期 ROI、後續投片量、公司 EPS 和增速等問題,目前美國經濟似乎也在下行,希望是軟着陸,如果是硬着陸,這些可能會戛然而止,投資也不會如計劃般那麼多。因此 AMD 和英偉達都會緊密跟蹤 CSP 客户,步步為營。

事實上,也有人認為英偉達和 AMD 都擔心客户砍單。

最終 AI 是否是個偽命題,將取決於未來 CSP 公司的 EPS 是否能夠被 justify、他們對於 AI 的投資是否有合適的回報,例如微軟,在 Copilot 的財務回報上也不太敢呈現。

如果相關業務真正盈利很多錢,應該會體現在財報上,並大力宣傳 AI 給其的盈利進而刺激下一波浪潮,但如果廠商計算不清楚或不敢批量 AI 的投資和對收入、EPS 的貢獻的話,就不清楚投資者或股東對這件事的想法,可能會基於 EPS 的壓力而減少開支。

儘管前途撲朔迷離,不過英偉達和 AMD 認為至少至明年上半年都沒問題,包括台積電也這麼認為。但下半年情況如何尚不確定。當然,還有一個重要的因素是大環境,如果經濟比較疲軟,公司也會考慮資本開支是否仍然持續保持這麼高水平。

AI 是否能帶來大量收入並非今年才有的問題。實際上 2023 年 AI 出現不久市場就所有擔心。不過 2023 年台積電擴產能時依舊堅決,主要還是因為客户有明確的下單。

另外,AI 是新出的事物,2022 年開始從零起步,目前的量已經逐步建設起來,一年 600K,這裏 600K 是逐步擴產的,2025 的 600K 在 EQ 時可能很多機器並未到位,到 2026 年時,量可能是 25Q4 的量乘以 4,即 210k 乘以 4,大概 800K+,台積電也認為 800K 的量可能是高峰期,除非客户有明確的需求,否則在當下時刻再增加很多量可能並不現實。

在存儲芯片方面,美光換了 2 次機台,目前良率已經有所改善。

他們換成了 Hanmi,大約 10 台設備,另外因為產能不夠,仍在繼續採購 Shibaura 的設備。Wafer 的前道製程也換了供應商,SUSS 似乎已經 out,可能換成 TEL。

未來,存儲在 AI 這邊以後會是關鍵角色,而不是 HBM,他們正在研究和關注新的方向,類似是做在 Moblie 的 DRAM 上的。

HBM 目前是眾人嫌棄的對象。原本用於手機上的 LPDDR 的封裝架構以及其前道突破的部分,以後不會主要放在 HBM。以後無論 EUV 前道的納米制程,還是後道架構大改的 DRAM,還是下一代所有 DRAM 記憶體的 cache core,會落在 LPDDR 上。

這是因為目前用到的 AI 手機或 AI 電腦,由於缺少 HBM,即使裝載了 AI 芯片,也會遇到 memory wall 的問題。

HBM 已經確定是整個 AI 架構裏最耗電的部分,因此業內有討論用 LPDDR 去取代 HBM。

基於耗電的問題,存儲廠現在在開發下一代 LPDDR,它相對省電但可能頻寬不夠,需要靠前道納米技術的突破。雖然 LPDDR 後續可能無法完全取代 HBM,但可能會部分取代,進而造成 HBM 在後續某個時間點供過於求。這個時間點並不一定是明年,而是當下一代 LPDDR 出爐並部分取代 HBM 的那個時刻,可能是行業的拐點。

新一代的 LPDDR 甚至可能用到 Hybrid Bonding,這是一個很新的內容,業內正在討論中,目前業內對 HBM 都比較嫌棄,耗電大,進而造成散熱難的問題。散熱一般包括風冷、液冷和浸沒式液冷,如果浸沒式液冷都沒有辦法解決散熱問題,後續架構變大該如何解決呢?因此 CPO、LPDDR 是未來 AI 發展的關鍵所在。

B 系列流片正在推進中,RTO 的 die 已經開始測試,最後的 final 可能要等至 10 月中旬。所以 Blackwell 最終批量出貨可能 12 月,如果是第一顆那種早期的量 11 月份是有可能的。

目前來看,流片結果是好的概率較大,但良率方面仍需做調整和優化。

其實台積電前道做到這麼大 die 的良率也需要優化,基於英偉達和蘋果的 CPO 良率其實相差挺大,英偉達的良率並沒有非常高。差不多有 60~70%,如果看其他手機客户前道良率都在 80~90%。

CoWoS-L 良率 95% 但 UPH 低,不過 UPH 低只是做得慢,價格也更貴。UPH 只會影響到價格、毛利。

目前,英偉達和 AMD 都在台積電做 CPO,CPO 很多都是終端廠商自己設計的,因此設計才是決勝點,製作才找的台積電。AMD 會逐步起來,但完全超過英偉達可能有難度,因為軟件、生態差很多,CUDA 還是很厲害的。

專家:AMD 可能會找博通等原本做 CPO 和光引擎的公司,但可能只是將其買回來,真正決勝負的還是自己的 design,design 大部分是 AMD 和英偉達自己設計,而非 ASIC 或 outsource,因此這些廠商頂多是供應商的角色,這些他們應該不會外傳,因為這涉及整個系統架構如何配合的問題,有點類似上文所説的 SoW(System on Wafer)的意思。

綜合來看,代表着 AI 時代最先進算力的 Blackwell 正在英偉達和台積電的推動下穩步推進,而我們也有望迎來 AI 快速發展的新一年。$英偉達(NVDA.US)$台積電(TSM.US)

本文版權歸屬原作者/機構所有。

當前內容僅代表作者觀點,與本平台立場無關。內容僅供投資者參考,亦不構成任何投資建議。如對本平台提供的內容服務有任何疑問或建議,請聯絡我們。