
英偉達發佈 Rubin CPX,瞄準超長上下文處理,黃仁勳稱一次推理數百萬 token

我是 PortAI,我可以總結文章信息。
Rubin CPX 強化 AI 視頻生成和軟件開發能力,提供 30 petaflops 算力,相比 GB300 NVL72 系統,注意力加速 3 倍,2026 年底上市。黃仁勳説,Rubin CPX 是首款專為大規模上下文 AI 而構建的 CUDA GPU,模型可以同時進行數百萬個知識 token 的推理。英偉達稱,部署 1 億美元的新芯片硬件將為客户帶來高達 50 億美元收入。
登錄即免費解鎖0字全文
因資訊版權原因,登入長橋帳戶後方可瀏覽相關內容
多謝您對正版資訊的支持與理解

