赛道 Hyper | DeepSeek:算力需求的潜在逻辑

华尔街见闻
2025.01.27 13:39
portai
我是 PortAI,我可以总结文章信息。

陷阱还是机会?

作者:周源/华尔街见闻

1 月 27 日,英伟达美股盘前深度下跌,幅度超过 12%(截至北京时间 1 月 27 日 20:24),跌破了 2024 年 12 月 17 盘中的 126.86 美元低点。

黄仁勋恐怕做梦也没想到,撼动英伟达产业逻辑的,居然是一家中国私募。

1 月 20 日,管理基金规模超过 1000 亿元的中国顶级私募——幻方量化,旗下公司 “深度求索”(DeepSeek)推出的推理大模型 DeepSeek-R1(以下简称 DS-R1),以超越行业认知的超低训练成本和不亚于 OpenAI o1 正式版的性能(数学、代码、自然语言推理等),震撼了美国硅谷。

这个 GenAI 推理大模型的问世,实际上相当于中国技术问鼎全球第一梯队的宣言。从此,中国在尖端技术领域,将从追赶者,转变为有范式制定的实力。

这是 GenAI 时代真正的开始,而揭幕者,第一次是中国技术公司。

但就未来而言,英伟达产业逻辑,未必如眼下的英伟达巨幅滑落的股价那样,反而很可能会得以进一步强化。

此话如何理解?

DS-R1“秒破” 英伟达价值链

1 月 24 日,在大模型排名 Arena 上,DS-R1 基准测试升至全类别大模型第三。

其中,在风格控制类模型(StyleCtrl)分类中,DS-R1 与 OpenAI o1 并列第一,竞技场得分达到 1357 分,略超 OpenAI o1 的 1352 分。

OpenAI o1 是 OpenAI 在 2024 年 9 月 12 日正式对外发布的一款新模型,是 OpenAI 下一代 “推理” 模型中的首个产品。

DS-R1 实现与 OpenAI o1 几乎无差别的性能表现(部分开源小模型性能甚至超越了 o1),成本竟只有后者的 3%-5%(约 550 万美元)。

这颠覆了人们对实现尖端 AI 性能所需条件的既有认知,顺带把英伟达价值链条在瞬间干成了碎片。

目前,OpenAI o1 推出的 ChatGPT Pro 计划,月费高达 200 美元(约合人民币 1440 元,合计年费 17280 元人民币),对 ChatGPT Plus 或 Team 帐户每周有 50 次的访问限制。

若通过 API 使用 o1 预览版,则输入每百万 token 收费 15 美元(约合人民币 108 元),输出每百万收费 60 美元(约合人民币 432 元)。

花费约 1.7 万元人民币,每年只能问约 2600 次?

这种应用成本,非一般人能承受。

再看看 ChatGPT-4o,个人版月费约 20 美元(约合人民币 145 元,合计年费 1740 元人民币),也有提问次数限制。

相比之下,DS-R1 个人版使用免费;另据官方消息披露,DS-R1 API 服务定价为输入每百万 token 收费人民币 1 元(缓存命中)或 4 元(缓存未命中),输出每百万 token 收费人民币 16 元。

全世界人民都爱低成本但性能优异的应用,看着如此悬殊的价格差,美国人民也做出了自己的选择:目前,DS-R1 已飙升至 HuggingFace 上下载量最高的热门 GenAI 模型。

DS-R1 在苹果商店(AppStore)美区免费榜排名第四,超越 Google Gemini 和 Microsoft Copilot 等美国 GenAI 应用。

在技术迭代方面,DS-R1 为全开源模式,因而开发者和研究人员能更广泛地参与其中,集合全球的科技力量,推动生态技术创新和促进市场良性竞争;OpenAI o1 则是闭源模式,只能依靠 OpenAI 团队努力,并在此基础上,形成对英伟达产业逻辑的超强支撑。

可以预见,没有达到 DS-R1 性能的闭源模型公司,将大批量倒闭(若不想倒闭,那就加入 DS-R1 开源生态,这就叫 “打不过,就加入”);即使是 OpenAI,其闭源 API 的价值,也将重构。

现在,DS-R1 的强悍性能、低成本特性和开源模式,让全球有志于参与 GenAI 生态的商业组织和个人,能大规模推动生态应用的广度和深度。

可以说,DS-R1 将成为 GenAI 生态应用的催化剂,真正让世界进入 GenAI 应用时代。只不过这次,全新的 GenAI 时代的市场推动力,首次有了中国公司的身影。

在既有的认知中,中国公司虽能大幅降低产品成本,但技术却做不到领先全球,这次深度求索推出的 DS-R1,打破了 “虽然便宜但技术含量不足” 的旧模式,首次取得全新技术时代核心推力俱乐部门票。

中国技术力量在 GenAI 技术浪潮中,表现靓丽。深度求索,不是一个人在战斗。

此前,火遍业界的豆包大模型,也推出迭代版。

据豆包微信公众号消息,1 月 22 日,豆包大模型 1.5Pro 版本正式发布。

这款大模型在知识、代码、推理和中文等多项公开测评基准上成绩领先全球,综合得分优于 GPT-4o、Claude3.5 和 Sonnet 等硅谷一流模型。

英伟达逻辑结束了?

DS-R1 的出品公司深度求索,为创业型公司,并没有上市。

但在 1 月 27 日,参与深度求索天使轮和 Pre-A 轮融资机构背后的上市公司,开盘即 “一字板” 涨停。

公开资料显示,杭州东方嘉富基金参与深度求索天使轮投资。杭州东方嘉富基金隶属 “浙江东方” 旗下;而参与深度求索 Pre-A 轮融资的华金领越基金,背后上市公司是 “华金资本”。

这两个公司,在 1 月 27 日 A 股开盘即告涨停。

但为深度求索提供基础算力支持和基础设施的浪潮信息和中科曙光,以及与深度求索有产品技术合作的像拓尔思,因市场仍在构建逻辑过程中,涨跌就有了分化。

简单说下浪潮信息和中科曙光与深度求索的合作方向,前者为深度求索提供 AI 服务器集群(英伟达 H800),后者承建深度求索杭州训练中心液冷系统。

与 DS-R1 概念有关的 A 股公司,此次却不是映射,而是直接有实际相关性。

有映射关系的,这次是英伟达产业逻辑。

DS-R1 低成本实现强悍性能的本质在于提高了算力利用率,而非从此不需要算力或者对算力的需求减弱。

深度求索(DeepSeek)推出性能如此强悍的 DS-R1,会让业界看到,提升算力效率是现实的,能实现的;在吸收深度求索提升算力效率的思想和方法后,业界会加码算力规模,以实现更大利益的达成。

因此,DS-R1 并没有敲响英伟达产业逻辑的丧钟,相反,这实际进一步夯实了 “达链” 在二级市场统治力的基础。

可以用一个公式概括:

DeepSeek 提升算力效率的方法 + 更大规模的算力=没有天花板限制的利益

低成本、强性能的 DS-R1,会高度促进 GenAI 应用生态的繁荣速度。

从这个角度上看,海量开发者和应用方(包括 B 端商业组织和 C 端个体)的参与,会更进一步提升对算力供应商的需求。

这就像智能手机开源系统安卓加入手机应用生态后,对手机的移动 SoC 芯片和存储芯片的性能需求大幅度提升一样。

在 2024 年 12 月,深度求索推出 DS-V3 时,有评论认为:DeepSeek-V3 将支持私有部署和自主微调,为下游应用提供远大于闭源模型时代的发展空间。未来一两年,大概率将见证更丰富的推理芯片产品、更繁荣的 LLM 应用生态。

在人类发展史上,无论是哪个技术时代,最终都为了一个目标,或者说,只有实现这个目标,技术时代才有真正的推动力。

这个目标,就是利益。

商业价值,就本质而言,只是为了到达利益彼岸的桥梁。

GenAI 技术也不例外。

硅谷在过去的两年中(以 2022 年 11 月 30 日 OpenAI 推出 ChatGPT-3.5 为时间基准),投入的上千亿美元资本开支,也不是为了实现 “利他” 理想,而是为了利益——共赢不是否认利益,而是利益均沾。

从 2007 年史蒂夫·乔布斯推出初代 iPhone 至今,当真正催生繁荣的应用生态后,超越想象的巨大利益,才能滚滚而来。

因此,DS-R1,真正的价值,在于让全球 GenAI 的参与方,先看到、再学会如何用更低成本提升算力利用效率。

在 DS-R1 或 DS-V3 推出之前,原本花上 1 元钱得到的算力,形成的性能,达成了 1.5 元的收益,现在只要花 0.1 元,就能得到与之前投入 1 元相同的性能,实现相同的收益。

这时,你会怎么做?

是决定停止投入,还是选择加大力度?

如何选择,不言而喻。

因此,英伟达和 A 股 “达链”(比如铜缆连接)板块股价这次大幅下挫,若是巨 “坑”,也闪耀着某种稀有金属的色泽。