Deep Seek R2 要来了？在科技较量为核心的国别竞争中，AI 竞争已经变成了国别资产估值的底

發現

資訊

2025.06.05 11:41

Deep Seek R2 要来了？

在科技较量为核心的国别竞争中，AI 竞争已经变成了国别资产估值的底层锚定点之一。所以 R2 发布非常重要。

这两天 MS 发了个报告，意思是 R2 应该快来了。几个核心点，给大家总结一下：

a. 参数量 double： R2 模型的参数量可能有 1.2 万亿，接近 R1（R1——6710 亿，升级版 DeepSeek-R1-0528 是 6850 亿）的两倍；其中 780 亿是活跃参数，采用 MOE 构架。

b. 成本性价比无敌：每百万 tokens 输入成本是 0.07$, 对比 R1 是 0.15-16$，输出是 0.27$，对比 R1 是 2.19$。

c. 硬件要求不高：R2 训练是的是华为的升腾 910B，而 R1 是英伟达的 H100.

模型性能上：

1. 多语言：之前 R1 主要是英语为主的推理。R2 能处理多语言。

2. 多模态：不仅文本，还能处理图片、语音和视频数据。

3. 更广泛的强化学习：用了更大的数据库，模型逻辑性更强，推理更像真人。

4. 资源投入在推理阶段：而非训练阶段采用了通用奖励模型（GRM），在模型推理阶段而非训练阶段，通过增加计算资源，提升模型输出质量的方法。

$英偉達(NVDA.US) $阿里巴巴(BABA.US)

本文版權歸屬原作者/機構所有。

當前內容僅代表作者觀點，與本平台立場無關。內容僅供投資者參考，亦不構成任何投資建議。如對本平台提供的內容服務有任何疑問或建議，請聯絡我們。