Hardik Shah
2026.06.16 15:05

📢 最新消息: $Coreweave(CRWV.US) CoreWeave 在 MLPerf v6.0 中僅用 2.02 分鐘訓練完成 DeepSeek-V3 671B - $英偉達(NVDA.US)

👉 關鍵亮點:

CoreWeave 僅用 2.02 分鐘 訓練了 DeepSeek-V3 671B

➤ 該記錄是使用分佈在 2,048 個節點 上的 8,192 個 NVIDIA GB300 NVLink 72 GPU 實現的。

➤ CoreWeave 在 MLPerf Training v6.0 中發佈了 最快 的封閉/可用雲結果。

➤ DeepSeek-V3 在 4,096 個 GPU 上於 3.09 分鐘 內完成訓練。

➤ DeepSeek-V3 在 2,048 個 GPU 上於 5.54 分鐘 內完成訓練。

➤ CoreWeave 是 唯一 將 GB300 擴展到 2,048 個 GPU 以上的提交者。

➤ Llama-3.1-405B 在 4,096 個 GPU 上於 9.77 分鐘 內達到基準質量。

➤ GPT-OSS-20B 在 64-GPU HGX B200 集羣 上於 26.98 分鐘 內完成訓練。

➤ Llama-3.1-8B 在 相同的 64-GPU 集羣 上於 16.54 分鐘 內完成訓練。

➤ CoreWeave 表示所有結果均使用了其可供客户使用的 生產雲基礎設施

本文版權歸屬原作者/機構所有。

當前內容僅代表作者觀點,與本平台立場無關。內容僅供投資者參考,亦不構成任何投資建議。如對本平台提供的內容服務有任何疑問或建議,請聯絡我們。