
📢 最新消息: $Coreweave(CRWV.US) CoreWeave 在 MLPerf v6.0 中仅用 2.02 分钟训练完成 DeepSeek-V3 671B - $英伟达(NVDA.US)
👉 关键亮点:➤ CoreWeave 仅用 2.02 分钟 训练了 DeepSeek-V3 671B。➤ 该记录是使用分布在 2,048 个节点 上的 8,192 个 NVIDIA GB300 NVLink 72 GPU 实现的。➤ CoreWeave 在 MLPerf Training v6.0 中发布了 最快 的封闭/可用云结果。➤ DeepSeek-V3 在 4,096 个 GPU 上于 3.09 分钟 内完成训练。➤ DeepSeek-V3 在 2,048 个 GPU 上于 5.54 分钟 内完成训练。➤ CoreWeave 是 唯一 将 GB300 扩展到 2,048 个 GPU 以上的提交者。➤ Llama-3.1-405B 在 4,096 个 GPU 上于 9.77 分钟 内达到基准质量。➤ GPT-OSS-20B 在 64-GPU HGX B200 集群 上于 26.98 分钟 内完成训练。➤ Llama-3.1-8B 在 相同的 64-GPU 集群 上于 16.54 分钟 内完成训练。➤ CoreWeave 表示所有结果均使用了其可供客户使用的 生产云基础设施。本文版权归属原作者/机构所有。
当前内容仅代表作者观点,与本平台立场无关。内容仅供投资者参考,亦不构成任何投资建议。如对本平台提供的内容服务有任何疑问或建议,请联系我们。

