英伟达发布 Rubin CPX,瞄准超长上下文处理,黄仁勋称一次推理数百万 token

华尔街见闻
2025.09.09 15:18
portai
我是 PortAI,我可以总结文章信息。

Rubin CPX 强化 AI 视频生成和软件开发能力,提供 30 petaflops 算力,相比 GB300 NVL72 系统,注意力加速 3 倍,2026 年底上市。黄仁勋说,Rubin CPX 是首款专为大规模上下文 AI 而构建的 CUDA GPU,模型可以同时进行数百万个知识 token 的推理。英伟达称,部署 1 亿美元的新芯片硬件将为客户带来高达 50 亿美元收入。