作者:愛德華多·巴普蒂斯塔 北京,3 月 18 日(路透社)——上週在一個開發者平台上匿名出現的強大人工智能模型引發了猜測,認為中國初創公司 DeepSeek 可能正在悄然測試其下一代系統,以便在正式發佈之前做好準備。 這個名為 Hunter Alpha 的免費模型於 3 月 11 日在 AI 網關平台 OpenRouter 上出現,沒有任何開發者歸屬,後來該平台將其描述為 “隱形模型”。 在路透社進行的測試中,Hunter Alpha 聊天機器人自稱為 “一個主要在中文環境下訓練的中國 AI 模型”,並表示其訓練數據延續到 2025 年 5 月,這與 DeepSeek 自己的聊天機器人報告的知識截止點相同。 然而,當被問及其創造者時,該系統拒絕透露其開發者的身份。 “我只知道我的名字、我的參數規模和我的上下文窗口長度,” 聊天機器人説。 DeepSeek 和 OpenRouter 都沒有確認該模型的創造者,並且沒有回應評論請求。 Hunter Alpha 的個人資料頁面將其描述為一個擁有 1 萬億參數的模型,這意味着它是使用大約 1 萬億個可調值進行訓練的,這些值決定了系統如何處理語言和生成響應。參數更多的模型通常需要顯著更多的計算能力來運行。 該系統還宣傳了高達一百萬個標記的上下文窗口,這是衡量 AI 模型在單次交互中可以處理或記住多少文本的指標。一個標記大致對應於一小段文本,例如一個單詞的一部分。 “最引人注目的組合是 Hunter Alpha 的 100 萬個標記上下文與推理能力和免費訪問的結合,” 構建 AI 代理系統的工程師納比爾·哈烏阿姆説。 “大多數具有該上下文窗口的前沿模型在規模上都需要真實的成本,” 他補充道。 這些規格與當地媒體對 DeepSeek 下一代 V4 模型的預期相似,中國媒體報道稱該模型可能最早在 4 月發佈。DeepSeek 與許多中國競爭對手一樣資金充足,但由於其母公司是量化對沖基金而非科技集團,其結構較為特殊。 儘管這種重疊並未建立直接聯繫,但它加劇了開發者之間的猜測,認為這個匿名系統可能是 DeepSeek 即將發佈的早期測試版本。 “思維鏈模式可能是最強的信號,” AI 工程師丹尼爾·德赫斯特在模型發佈後分析時表示,指的是 AI 模型的推理方式。 “推理風格很難偽裝,往往反映了模型的訓練方式。” 他説,Hunter Alpha 的規模和記憶容量也與今年早些時候流傳的 DeepSeek V4 的規格相匹配。 不過,一些開發者警告説,將該模型與 DeepSeek 聯繫起來的證據並不確鑿。 “我的分析表明,Hunter Alpha 可能不是 DeepSeek V4,” 獨立 AI 基準測試負責人烏穆爾·奧茲庫爾説,他提到與 DeepSeek 現有系統相比,標記相關行為和架構模式的差異。 他説,考慮到時間和宣傳的能力,將該模型與 DeepSeek 聯繫起來的猜測是可以理解的。 開發者測試 匿名模型的發佈並不罕見,因為像 OpenRouter 這樣的平台允許開發者通過單一接口向數十個 AI 模型發送查詢,使其成為新系統的熱門測試場。 一個名為 Pony Alpha 的匿名模型於 2 月份出現在 OpenRouter 上,五天後中國公司 Zhipu AI 確認它是其 GLM-5 系統的一部分。 Hunter Alpha 個人資料頁面上的通知表示,所有模型的提示和完成 “都由提供者記錄,並可能用於改進模型”,強調了行業普遍採用隱形模型發佈以獲取無偏見反饋的做法。 該模型在平台上出現後迅速被採用,截至週日,根據 OpenRouter 的統計數據,處理了超過 1600 億個標記。 大部分活動來自軟件開發工具和 AI 代理框架,如 OpenClaw,這些工具允許 AI 系統自主規劃任務並與外部軟件互動。