
Deep Seek R2 要来了?
在科技较量为核心的国别竞争中,AI 竞争已经变成了国别资产估值的底层锚定点之一。所以 R2 发布非常重要。
这两天 MS 发了个报告,意思是 R2 应该快来了。几个核心点,给大家总结一下:
a. 参数量 double: R2 模型的参数量可能有 1.2 万亿,接近 R1(R1——6710 亿,升级版 DeepSeek-R1-0528 是 6850 亿)的两倍;其中 780 亿是活跃参数,采用 MOE 构架。
b. 成本性价比无敌:每百万 tokens 输入成本是 0.07$, 对比 R1 是 0.15-16$,输出是 0.27$,对比 R1 是 2.19$。
c. 硬件要求不高:R2 训练是的是华为的升腾 910B,而 R1 是英伟达的 H100.
模型性能上:
1. 多语言:之前 R1 主要是英语为主的推理。R2 能处理多语言。
2. 多模态:不仅文本,还能处理图片、语音和视频数据。
3. 更广泛的强化学习:用了更大的数据库,模型逻辑性更强,推理更像真人。
4. 资源投入在推理阶段:而非训练阶段采用了通用奖励模型(GRM),在模型推理阶段而非训练阶段,通过增加计算资源,提升模型输出质量的方法。
$英偉達(NVDA.US) $阿里巴巴(BABA.US)
本文版權歸屬原作者/機構所有。
當前內容僅代表作者觀點,與本平台立場無關。內容僅供投資者參考,亦不構成任何投資建議。如對本平台提供的內容服務有任何疑問或建議,請聯絡我們。

