馬斯克詳解:xAI 如何在 122 天內搭建上線 10 萬張卡訓練集羣

華爾街見聞
2025.02.19 01:31
portai
我是 PortAI,我可以總結文章信息。

埃隆·馬斯克主持了 Grok 3 的發佈會,介紹了其核心特點和新工具 “Deep Search”。xAI 團隊在 122 天內成功搭建了全球最大訓練集羣,使用 10 萬個 H100 GPU 進行協調訓練。團隊面臨的挑戰包括確保所有 GPU 的協同工作,以避免因單個 GPU 故障導致的訓練錯誤。馬斯克強調了團隊的工程成就,打破了數據中心提供商的預期時間。