英偉達發佈 Rubin CPX,瞄準超長上下文處理,黃仁勳稱一次推理數百萬 token

華爾街見聞
2025.09.09 15:18
portai
我是 PortAI,我可以總結文章信息。

Rubin CPX 強化 AI 視頻生成和軟件開發能力,提供 30 petaflops 算力,相比 GB300 NVL72 系統,注意力加速 3 倍,2026 年底上市。黃仁勳説,Rubin CPX 是首款專為大規模上下文 AI 而構建的 CUDA GPU,模型可以同時進行數百萬個知識 token 的推理。英偉達稱,部署 1 億美元的新芯片硬件將為客户帶來高達 50 億美元收入。