DIGITIMES ASIA:专家指出,AI 工作负载的激增为替代内存和芯粒技术带来了机遇

prnewswire
2025.12.02 02:52
portai
我是 PortAI,我可以总结文章信息。

AI 工作负载的快速扩展正在推动数据中心基础设施的根本重设计,导致内存短缺,并为 MRAM 和 RRAM 等替代内存技术创造了机会。Chuck Sobey 强调了 AI 系统对内存带宽和功率密度的前所未有的需求,这导致了经济后果和供应链压力。芯片组架构被确定为整合替代内存的关键推动力。Sobey 将在即将举行的活动中进一步讨论这些影响

, /PRNewswire/ -- 人工智能(AI)工作负载的快速扩展迫使数据中心基础设施进行根本性重新设计,导致历史性的内存短缺,并为替代内存技术打开了一个难得的市场窗口,ChannelScience 创始人兼 Chiplet Summit 主席 Chuck Sobey 表示。

继续阅读

来源:Digitimes

在谈到行业转变时,Sobey 强调 AI 工作负载在结构上与传统企业任务不同。虽然传统工作负载对 CPU、网络和存储施加压力——常常使处理器等待 I/O——但现代 AI 任务,如深度学习训练、大型语言模型(LLM)推理和检索增强生成(RAG),在内存带宽上受到严重限制。

带宽差距和电力危机

AI 时代的需求是前所未有的。Sobey 指出,AI 系统可能需要高达每秒 10 太字节(TB/s)的 GPU 内存访问——大约是标准 DDR5 带宽的 50 到 200 倍。与处理千字节的网络和云请求不同,AI 访问涉及的是以千兆字节为单位的张量,要求算法能够利用整个内存存储层次结构。

这种架构压力带来了深远的经济后果。Sobey 将现代 AI 数据中心描述为一个 “令牌工厂”,其收入完全来自处理令牌。目前,这些设施的限制在于电力和内存,而不是计算能力。电力密度要求正在飙升,迫使机架重新设计以支持高达一兆瓦——超出以前标准的 10 到 100 倍。

供应链已经在这种压力下崩溃。Sobey 指出,内存行业出现了历史性的短缺,特别是高性能服务器内存,订单的履行率仅为 70%,价格上涨高达 50%。对于除最大规模的超大规模数据中心外,确保必要的内存库存变得越来越困难。

芯片组:MRAM 和 RRAM 的入口

Sobey 将这种供应/电力危机视为 “替代内存” 的战略切入点——如 MRAM(磁阻 RAM)、RRAM(电阻 RAM)和相变内存(PCM)等技术,它们缺乏现有厂商的专用数十亿美元的晶圆厂。

芯片组架构是这一转型的关键推动力。通过将功能从单一的 ASIC 解耦为更小的单元,芯片组允许设计师整合替代内存所需的特殊材料,而不污染高端逻辑制造过程。这种异构集成带来了特定的性能优势,如辐射耐受性或高温抗性,Sobey 认为这些是超越简单成本主张的必要差异化因素。

新的 “五秒规则”

AI 的速度也在压缩经济经验法则。Sobey 观察到,长期以来的 “五分钟规则”——即如果在五分钟内访问的数据应保留在 DRAM 中——已加速为 “五秒规则”。在 AI 时代,如果数据在五秒内未被访问,成本效益分析表明它必须从昂贵的快速内存层中剔除。

Sobey 表示,目前 AI 的激增不是微小的涟漪,而是一股汇聚的浪潮,他认为供应商需要现在就巩固自己的地位,以便在定价和供应链最终稳定时保持竞争优势。

Sobey 将在 2025 年 12 月 5 日的 DIGITIMES 网络研讨会 和定于 2026 年 2 月 17-19 日在加利福尼亚州圣克拉拉举行的 Chiplet Summit 上进一步讨论芯片组对内存存储层次结构的影响。

来源:DIGITIMES ASIA