DIGITIMES ASIA:專家指出,AI 工作負載的激增為替代內存和芯粒技術帶來了機遇

prnewswire
2025.12.02 02:52
portai
我是 PortAI,我可以總結文章信息。

AI 工作負載的快速擴展正在推動數據中心基礎設施的根本重設計,導致內存短缺,併為 MRAM 和 RRAM 等替代內存技術創造了機會。Chuck Sobey 強調了 AI 系統對內存帶寬和功率密度的前所未有的需求,這導致了經濟後果和供應鏈壓力。芯片組架構被確定為整合替代內存的關鍵推動力。Sobey 將在即將舉行的活動中進一步討論這些影響

, /PRNewswire/ -- 人工智能(AI)工作負載的快速擴展迫使數據中心基礎設施進行根本性重新設計,導致歷史性的內存短缺,併為替代內存技術打開了一個難得的市場窗口,ChannelScience 創始人兼 Chiplet Summit 主席 Chuck Sobey 表示。

繼續閲讀

來源:Digitimes

在談到行業轉變時,Sobey 強調 AI 工作負載在結構上與傳統企業任務不同。雖然傳統工作負載對 CPU、網絡和存儲施加壓力——常常使處理器等待 I/O——但現代 AI 任務,如深度學習訓練、大型語言模型(LLM)推理和檢索增強生成(RAG),在內存帶寬上受到嚴重限制。

帶寬差距和電力危機

AI 時代的需求是前所未有的。Sobey 指出,AI 系統可能需要高達每秒 10 太字節(TB/s)的 GPU 內存訪問——大約是標準 DDR5 帶寬的 50 到 200 倍。與處理千字節的網絡和雲請求不同,AI 訪問涉及的是以千兆字節為單位的張量,要求算法能夠利用整個內存存儲層次結構。

這種架構壓力帶來了深遠的經濟後果。Sobey 將現代 AI 數據中心描述為一個 “令牌工廠”,其收入完全來自處理令牌。目前,這些設施的限制在於電力和內存,而不是計算能力。電力密度要求正在飆升,迫使機架重新設計以支持高達一兆瓦——超出以前標準的 10 到 100 倍。

供應鏈已經在這種壓力下崩潰。Sobey 指出,內存行業出現了歷史性的短缺,特別是高性能服務器內存,訂單的履行率僅為 70%,價格上漲高達 50%。對於除最大規模的超大規模數據中心外,確保必要的內存庫存變得越來越困難。

芯片組:MRAM 和 RRAM 的入口

Sobey 將這種供應/電力危機視為 “替代內存” 的戰略切入點——如 MRAM(磁阻 RAM)、RRAM(電阻 RAM)和相變內存(PCM)等技術,它們缺乏現有廠商的專用數十億美元的晶圓廠。

芯片組架構是這一轉型的關鍵推動力。通過將功能從單一的 ASIC 解耦為更小的單元,芯片組允許設計師整合替代內存所需的特殊材料,而不污染高端邏輯製造過程。這種異構集成帶來了特定的性能優勢,如輻射耐受性或高温抗性,Sobey 認為這些是超越簡單成本主張的必要差異化因素。

新的 “五秒規則”

AI 的速度也在壓縮經濟經驗法則。Sobey 觀察到,長期以來的 “五分鐘規則”——即如果在五分鐘內訪問的數據應保留在 DRAM 中——已加速為 “五秒規則”。在 AI 時代,如果數據在五秒內未被訪問,成本效益分析表明它必須從昂貴的快速內存層中剔除。

Sobey 表示,目前 AI 的激增不是微小的漣漪,而是一股匯聚的浪潮,他認為供應商需要現在就鞏固自己的地位,以便在定價和供應鏈最終穩定時保持競爭優勢。

Sobey 將在 2025 年 12 月 5 日的 DIGITIMES 網絡研討會 和定於 2026 年 2 月 17-19 日在加利福尼亞州聖克拉拉舉行的 Chiplet Summit 上進一步討論芯片組對內存存儲層次結構的影響。

來源:DIGITIMES ASIA