英伟达官宣新合作成就:Mistral 开源模型提速,任意规模均提高效率和精度

华尔街见闻
2025.12.02 20:03
portai
我是 PortAI,我可以总结文章信息。

通过为大型先进混合专家模型(MoE)定制的优化技术,Mistral Large 3 在英伟达 GB200 NVL72 系统上实现了同类最佳性能,相比前代 H200 芯片的性能提升 10 倍,每 MW 能耗可实现每秒超过 500 万 token 的处理速度。Ministral 3 系列小模型在英伟达 RTX 5090 GPU 上可实现每秒最高 385 个 token 的推理速度。