
英伟达官宣新合作成就:Mistral 开源模型提速,任意规模均提高效率和精度

我是 PortAI,我可以总结文章信息。
通过为大型先进混合专家模型(MoE)定制的优化技术,Mistral Large 3 在英伟达 GB200 NVL72 系统上实现了同类最佳性能,相比前代 H200 芯片的性能提升 10 倍,每 MW 能耗可实现每秒超过 500 万 token 的处理速度。Ministral 3 系列小模型在英伟达 RTX 5090 GPU 上可实现每秒最高 385 个 token 的推理速度。
登录即免费解锁0字全文
因资讯版权原因,登录长桥账户后方可浏览相关内容
感谢您对正版资讯的理解与支持

