
英偉達官宣新合作成就:Mistral 開源模型提速,任意規模均提高效率和精度

我是 PortAI,我可以總結文章信息。
通過為大型先進混合專家模型(MoE)定製的優化技術,Mistral Large 3 在英偉達 GB200 NVL72 系統上實現了同類最佳性能,相比前代 H200 芯片的性能提升 10 倍,每 MW 能耗可實現每秒超過 500 萬 token 的處理速度。Ministral 3 系列小模型在英偉達 RTX 5090 GPU 上可實現每秒最高 385 個 token 的推理速度。
登錄即免費解鎖0字全文
因資訊版權原因,登入長橋帳戶後方可瀏覽相關內容
多謝您對正版資訊的支持與理解

