
英伟达发布 Rubin CPX,瞄准超长上下文处理,黄仁勋称一次推理数百万 token

我是 PortAI,我可以总结文章信息。
Rubin CPX 强化 AI 视频生成和软件开发能力,提供 30 petaflops 算力,相比 GB300 NVL72 系统,注意力加速 3 倍,2026 年底上市。黄仁勋说,Rubin CPX 是首款专为大规模上下文 AI 而构建的 CUDA GPU,模型可以同时进行数百万个知识 token 的推理。英伟达称,部署 1 亿美元的新芯片硬件将为客户带来高达 50 亿美元收入。
登录即免费解锁0字全文
因资讯版权原因,登录长桥账户后方可浏览相关内容
感谢您对正版资讯的理解与支持

