DeepSeek 火出圈,英偉達完了嗎?

華爾街見聞
2024.12.28 12:15
portai
我是 PortAI,我可以總結文章信息。

DeepSeek v3 的訓練算力需求顯著降低,得益於算法進步和數據蒸餾等因素,使得後發模型訓練更為高效。儘管幻方在 GPT4o 發佈後用 1/10 的算力實現相似水平,但訓練成本的計算需考慮前期研究的投入。未來合成數據將是突破數據限制的重要來源,整體訓練算力需求仍在上升,OpenAI 和 Anthropic 等實驗室也面臨算力不足的問題。