英伟达 Blackwell 推进顺利,台积电继续受益

portai
我是 PortAI,我可以总结文章信息。

近期,有消息称,8 月份的时候,针对新产品 Blackwell,英伟达修改了光罩(mask),进了一次新的 super hot run,听过 10 月中旬可能出流片结果。目前流片进展顺利。

不过行业专家认为,最终还需要大量跑量来进行批量测试,得到统计数据,再来确定良率是否合格,可能下个阶段就进行。目前看,光罩改良后,设计层面电路、线路改良后效果目测较好。

之前上次 Blackwell 的问题,可能不仅仅是光罩,bridge die 设计在两个晶片 top 上这部分也有不顺利的情况,因此英伟达也和 TSMC 团队一起工作看如何解决和改善,以让 2 个晶片中间的 top 更加顺利,减少频宽问题。

关于 warpage,应该得到一致,也选定了 TC 机器,可能是 K&S,大约 18 台,用于 CoWoS-L 的 Fluxless 制程,其 TC Fluxless 目前听说已经 qualified,所以应该不是 ASM。

另外,(台积电)先进封装 CoWoS wafer 的期望值预计在明年 Q3~Q4 翻倍,届时单 CoWoS-L 可能就达到每季度 10 万片。

目前 CoWoS wafer 约 300k/年,明年可能翻倍至 600K~700K(其中 600K 的数字还未包含台积电所购买的群创南科四厂,进行玻璃基板的先进封装)。

该数字建立在目前的预期进度上,但台积电也担心,目前能见度只能看到 2025 年上半年,大约 7 月之前,而对于下半年情况台积电也并不清楚,具体量会扩产到何种程度。

还需看英伟达和 AMD。AMD 相对还比较乐观,架构也在修改。

目前一些可以确定的是,AI 之后的 CPO 会是一个主战场,AMD 和英伟达目前也在设计其自己的 CPO,目前铜线支撑的电流快到极限,因此可能要尽快上 CPO,目前各家都有自己的 CPO 设计,也在和台积电去 work 这件事,例如台积电说的 SoW(System on Wafer)这种新架构,是用 Silicon Photonics 去做。另外,DIE 会走 MCM,也一定会走 chiplet。

AMD 目前比较乐观,主要基于其紧密地跟踪客户库存,他们一直在拜访头部 CSP 客户,咨询库存情况。但目前得到的回复似乎不够多,因此 AMD 也会担心这是否会影响后期 ROI、后续投片量、公司 EPS 和增速等问题,目前美国经济似乎也在下行,希望是软着陆,如果是硬着陆,这些可能会戛然而止,投资也不会如计划般那么多。因此 AMD 和英伟达都会紧密跟踪 CSP 客户,步步为营。

事实上,也有人认为英伟达和 AMD 都担心客户砍单。

最终 AI 是否是个伪命题,将取决于未来 CSP 公司的 EPS 是否能够被 justify、他们对于 AI 的投资是否有合适的回报,例如微软,在 Copilot 的财务回报上也不太敢呈现。

如果相关业务真正盈利很多钱,应该会体现在财报上,并大力宣传 AI 给其的盈利进而刺激下一波浪潮,但如果厂商计算不清楚或不敢批量 AI 的投资和对收入、EPS 的贡献的话,就不清楚投资者或股东对这件事的想法,可能会基于 EPS 的压力而减少开支。

尽管前途扑朔迷离,不过英伟达和 AMD 认为至少至明年上半年都没问题,包括台积电也这么认为。但下半年情况如何尚不确定。当然,还有一个重要的因素是大环境,如果经济比较疲软,公司也会考虑资本开支是否仍然持续保持这么高水平。

AI 是否能带来大量收入并非今年才有的问题。实际上 2023 年 AI 出现不久市场就所有担心。不过 2023 年台积电扩产能时依旧坚决,主要还是因为客户有明确的下单。

另外,AI 是新出的事物,2022 年开始从零起步,目前的量已经逐步建设起来,一年 600K,这里 600K 是逐步扩产的,2025 的 600K 在 EQ 时可能很多机器并未到位,到 2026 年时,量可能是 25Q4 的量乘以 4,即 210k 乘以 4,大概 800K+,台积电也认为 800K 的量可能是高峰期,除非客户有明确的需求,否则在当下时刻再增加很多量可能并不现实。

在存储芯片方面,美光换了 2 次机台,目前良率已经有所改善。

他们换成了 Hanmi,大约 10 台设备,另外因为产能不够,仍在继续采购 Shibaura 的设备。Wafer 的前道制程也换了供应商,SUSS 似乎已经 out,可能换成 TEL。

未来,存储在 AI 这边以后会是关键角色,而不是 HBM,他们正在研究和关注新的方向,类似是做在 Moblie 的 DRAM 上的。

HBM 目前是众人嫌弃的对象。原本用于手机上的 LPDDR 的封装架构以及其前道突破的部分,以后不会主要放在 HBM。以后无论 EUV 前道的纳米制程,还是后道架构大改的 DRAM,还是下一代所有 DRAM 记忆体的 cache core,会落在 LPDDR 上。

这是因为目前用到的 AI 手机或 AI 电脑,由于缺少 HBM,即使装载了 AI 芯片,也会遇到 memory wall 的问题。

HBM 已经确定是整个 AI 架构里最耗电的部分,因此业内有讨论用 LPDDR 去取代 HBM。

基于耗电的问题,存储厂现在在开发下一代 LPDDR,它相对省电但可能频宽不够,需要靠前道纳米技术的突破。虽然 LPDDR 后续可能无法完全取代 HBM,但可能会部分取代,进而造成 HBM 在后续某个时间点供过于求。这个时间点并不一定是明年,而是当下一代 LPDDR 出炉并部分取代 HBM 的那个时刻,可能是行业的拐点。

新一代的 LPDDR 甚至可能用到 Hybrid Bonding,这是一个很新的内容,业内正在讨论中,目前业内对 HBM 都比较嫌弃,耗电大,进而造成散热难的问题。散热一般包括风冷、液冷和浸没式液冷,如果浸没式液冷都没有办法解决散热问题,后续架构变大该如何解决呢?因此 CPO、LPDDR 是未来 AI 发展的关键所在。

B 系列流片正在推进中,RTO 的 die 已经开始测试,最后的 final 可能要等至 10 月中旬。所以 Blackwell 最终批量出货可能 12 月,如果是第一颗那种早期的量 11 月份是有可能的。

目前来看,流片结果是好的概率较大,但良率方面仍需做调整和优化。

其实台积电前道做到这么大 die 的良率也需要优化,基于英伟达和苹果的 CPO 良率其实相差挺大,英伟达的良率并没有非常高。差不多有 60~70%,如果看其他手机客户前道良率都在 80~90%。

CoWoS-L 良率 95% 但 UPH 低,不过 UPH 低只是做得慢,价格也更贵。UPH 只会影响到价格、毛利。

目前,英伟达和 AMD 都在台积电做 CPO,CPO 很多都是终端厂商自己设计的,因此设计才是决胜点,制作才找的台积电。AMD 会逐步起来,但完全超过英伟达可能有难度,因为软件、生态差很多,CUDA 还是很厉害的。

专家:AMD 可能会找博通等原本做 CPO 和光引擎的公司,但可能只是将其买回来,真正决胜负的还是自己的 design,design 大部分是 AMD 和英伟达自己设计,而非 ASIC 或 outsource,因此这些厂商顶多是供应商的角色,这些他们应该不会外传,因为这涉及整个系统架构如何配合的问题,有点类似上文所说的 SoW(System on Wafer)的意思。

综合来看,代表着 AI 时代最先进算力的 Blackwell 正在英伟达和台积电的推动下稳步推进,而我们也有望迎来 AI 快速发展的新一年。$英伟达(NVDA.US)$台积电(TSM.US)

本文版权归属原作者/机构所有。

当前内容仅代表作者观点,与本平台立场无关。内容仅供投资者参考,亦不构成任何投资建议。如对本平台提供的内容服务有任何疑问或建议,请联系我们。