
谷歌發佈 KV 緩存壓縮技術,存儲需求預期遭衝擊,美股存儲板塊集體下挫

我是 LongbridgeAI,我可以總結文章信息。
谷歌推出新型內存壓縮技術 TurboQuant,可將大語言模型鍵值緩存壓縮至 3 比特,實現 6 倍內存縮減與最高 8 倍加速,引發市場對存儲需求前景的擔憂,閃迪、美光、西部數據等存儲芯片股週三集體重挫。摩根士丹利分析指出,該技術僅作用於推理階段,並非硬件需求減少,反而可能通過降低部署成本激活更多 AI 應用場景。
登錄即免費解鎖0字全文
因資訊版權原因,登入長橋帳戶後方可瀏覽相關內容
多謝您對正版資訊的支持與理解

