作者:爱德华多·巴普蒂斯塔 北京,3 月 18 日(路透社)——上周在一个开发者平台上匿名出现的强大人工智能模型引发了猜测,认为中国初创公司 DeepSeek 可能正在悄然测试其下一代系统,以便在正式发布之前做好准备。 这个名为 Hunter Alpha 的免费模型于 3 月 11 日在 AI 网关平台 OpenRouter 上出现,没有任何开发者归属,后来该平台将其描述为 “隐形模型”。 在路透社进行的测试中,Hunter Alpha 聊天机器人自称为 “一个主要在中文环境下训练的中国 AI 模型”,并表示其训练数据延续到 2025 年 5 月,这与 DeepSeek 自己的聊天机器人报告的知识截止点相同。 然而,当被问及其创造者时,该系统拒绝透露其开发者的身份。 “我只知道我的名字、我的参数规模和我的上下文窗口长度,” 聊天机器人说。 DeepSeek 和 OpenRouter 都没有确认该模型的创造者,并且没有回应评论请求。 Hunter Alpha 的个人资料页面将其描述为一个拥有 1 万亿参数的模型,这意味着它是使用大约 1 万亿个可调值进行训练的,这些值决定了系统如何处理语言和生成响应。参数更多的模型通常需要显著更多的计算能力来运行。 该系统还宣传了高达一百万个标记的上下文窗口,这是衡量 AI 模型在单次交互中可以处理或记住多少文本的指标。一个标记大致对应于一小段文本,例如一个单词的一部分。 “最引人注目的组合是 Hunter Alpha 的 100 万个标记上下文与推理能力和免费访问的结合,” 构建 AI 代理系统的工程师纳比尔·哈乌阿姆说。 “大多数具有该上下文窗口的前沿模型在规模上都需要真实的成本,” 他补充道。 这些规格与当地媒体对 DeepSeek 下一代 V4 模型的预期相似,中国媒体报道称该模型可能最早在 4 月发布。DeepSeek 与许多中国竞争对手一样资金充足,但由于其母公司是量化对冲基金而非科技集团,其结构较为特殊。 尽管这种重叠并未建立直接联系,但它加剧了开发者之间的猜测,认为这个匿名系统可能是 DeepSeek 即将发布的早期测试版本。 “思维链模式可能是最强的信号,” AI 工程师丹尼尔·德赫斯特在模型发布后分析时表示,指的是 AI 模型的推理方式。 “推理风格很难伪装,往往反映了模型的训练方式。” 他说,Hunter Alpha 的规模和记忆容量也与今年早些时候流传的 DeepSeek V4 的规格相匹配。 不过,一些开发者警告说,将该模型与 DeepSeek 联系起来的证据并不确凿。 “我的分析表明,Hunter Alpha 可能不是 DeepSeek V4,” 独立 AI 基准测试负责人乌穆尔·奥兹库尔说,他提到与 DeepSeek 现有系统相比,标记相关行为和架构模式的差异。 他说,考虑到时间和宣传的能力,将该模型与 DeepSeek 联系起来的猜测是可以理解的。 开发者测试 匿名模型的发布并不罕见,因为像 OpenRouter 这样的平台允许开发者通过单一接口向数十个 AI 模型发送查询,使其成为新系统的热门测试场。 一个名为 Pony Alpha 的匿名模型于 2 月份出现在 OpenRouter 上,五天后中国公司 Zhipu AI 确认它是其 GLM-5 系统的一部分。 Hunter Alpha 个人资料页面上的通知表示,所有模型的提示和完成 “都由提供者记录,并可能用于改进模型”,强调了行业普遍采用隐形模型发布以获取无偏见反馈的做法。 该模型在平台上出现后迅速被采用,截至周日,根据 OpenRouter 的统计数据,处理了超过 1600 亿个标记。 大部分活动来自软件开发工具和 AI 代理框架,如 OpenClaw,这些工具允许 AI 系统自主规划任务并与外部软件互动。