DeepSeek 火出圈,英伟达完了吗?

华尔街见闻
2024.12.28 12:15
portai
我是 PortAI,我可以总结文章信息。

DeepSeek v3 的训练算力需求显著降低,得益于算法进步和数据蒸馏等因素,使得后发模型训练更为高效。尽管幻方在 GPT4o 发布后用 1/10 的算力实现相似水平,但训练成本的计算需考虑前期研究的投入。未来合成数据将是突破数据限制的重要来源,整体训练算力需求仍在上升,OpenAI 和 Anthropic 等实验室也面临算力不足的问题。