--- title: "DeepSeek 新模型來了?" type: "News" locale: "zh-HK" url: "https://longbridge.com/zh-HK/news/275594904.md" description: "DeepSeek 正灰度測試新一代模型。部分用户打開 App 後收到更新版本的提示,新版本上下文長度從 128K 擴展至 1M,知識庫更新至 2025 年 5 月,官方 App 顯示或是 V4 正式亮相前的終極灰度版。野村證券報告指出,V4 的核心價值在於通過底層架構創新推動 AI 應用商業化落地,而非顛覆現有 AI 價值鏈。" datetime: "2026-02-11T11:18:25.000Z" locales: - [zh-CN](https://longbridge.com/zh-CN/news/275594904.md) - [en](https://longbridge.com/en/news/275594904.md) - [zh-HK](https://longbridge.com/zh-HK/news/275594904.md) --- > 支持的語言: [简体中文](https://longbridge.com/zh-CN/news/275594904.md) | [English](https://longbridge.com/en/news/275594904.md) # DeepSeek 新模型來了? DeepSeek 正在推進新版本模型的灰度測試,或是 V4 正式亮相前的終極灰度版。 2 月 11 日,部分用户打開 DeepSeek App 後收到更新版本的提示。APP 更新後(1.7.4),用户可體驗到 DeepSeek最新模型。本次升級後,模型上下文長度將從 128K 擴展至 1M,接近提升 10 倍;知識庫更新至 2025 年 5 月,多項核心能力獲得實質性提升。 作者實測發現,DeepSeek 在問答中稱,當前的版本很可能也不是 V4,**極有可能是 V3 系列的最終進化形態,或是 V4 正式亮相前的終極灰度版。** 野村證券於 2 月 10 日發佈報告稱,**預計 2026 年 2 月中旬推出的 DeepSeek V4 模型,不會重現去年 V3 發佈時引發的全球 AI 算力需求恐慌。**該行認為,**V4 的核心價值在於通過底層架構創新推動 AI 應用商業化落地,而非顛覆現有 AI 價值鏈。** 據測評,**新版本在複雜任務處理能力上已對齊 Gemini 3 Pro 及 K2.5 等主流閉源模型。**野村進一步指出,V4 預計將引入 mHC 與 Engram 兩項創新技術,從算法與工程層面突破算力芯片與內存瓶頸。內部初步測試顯示,V4 在編程任務中的表現已超越 Anthropic Claude 及 OpenAI GPT 系列同代模型。 **此次發佈的關鍵意義在於進一步壓縮訓練與推理成本,為全球大語言模型及 AI 應用企業緩解資本開支壓力提供可行路徑。** ## 創新架構針對硬件瓶頸優化 野村證券報告指出,算力芯片性能與 HBM 內存瓶頸,始終是國產大模型產業繞不開的硬約束。**即將發佈的 DeepSeek V4 所引入的 mHC(超連接與流形約束超連接)與 Engram 架構,正是從訓練與推理兩個維度,針對上述短板進行系統級優化。** > **mHC**: > > - 全稱為 “流形約束超連接”。它旨在解決 Transformer 模型在層數極深時,信息流動的瓶頸和訓練不穩定的問題。 > > - 簡單説,它讓神經網絡層之間的 “對話” 更豐富、更靈活,同時通過嚴苛的數學 “護欄” 防止信息被放大或破壞。**實驗證明,採用 mHC 的模型在數學推理等任務上表現更優。** > > > > > **Engram**: > > - 一個 “條件記憶” 模塊。它的設計理念是將 “記憶” 與 “計算” 解耦。 > > - 模型中的靜態知識(如實體、固定表達)被專門存儲在一個稀疏的內存表中,這個表可以放在廉價的 DRAM 裏。當需要推理時,再去快速查找。**這釋放了昂貴的 GPU 內存(HBM),讓其專注於動態計算。** > > > mHC 技術通過改善訓練穩定性和收斂效率,在一定程度對沖國產芯片在互聯帶寬與計算密度上的代際差距;而 Engram 架構則致力於重構內存調度機制,在 HBM 供應受限的背景下,以更高效的存取策略突破顯存容量與帶寬制約。野村認為,**這兩項創新共同構成一套面向國產硬件生態的適配方案,具有明確的工程落地價值。** 報告進一步指出,**V4 發佈帶來的最直接商業影響,是訓練與推理成本的實質性下降**。成本端的優化將有效激發下游應用需求,進而催生新一輪 AI 基礎設施建設週期。在此過程中,**中國 AI 硬件廠商有望受益於需求放量與投資前置帶來的雙重拉動。** ## 市場格局從"一家獨大"轉向"羣雄割據" 野村報告回顧了 DeepSeek-V3/R1 發佈一年後的市場格局變化。在 2024 年底,DeepSeek 的兩個模型曾佔據 OpenRouter 上開源模型 Token 使用量的一半以上。 但到 2025 年下半年,隨着更多玩家加入,其市場份額已顯著下降。市場從"一家獨大"走向了"羣雄割據"。**V4 面臨的競爭環境遠比一年前複雜。DeepSeek 的"算力管理效率"疊加"性能提升"加速了中國大語言模型與應用發展,也改變了全球競爭格局,推動開源模型更受關注。** ## 軟件公司迎來價值提升機遇 野村認為,**全球主要雲服務商正全力追逐通用人工智能,資本開支競賽遠未停歇,因此 V4 預計不會對全球 AI 基礎設施市場造成去年那種級別的衝擊波。** 但全球大模型及應用開發商正揹負着日益沉重的資本開支負擔。**V4 若能在維持高性能的同時顯著降低訓練與推理成本,將幫助這些企業更快地將技術轉化為收入,緩解盈利壓力。** 在應用側,更強大、更高效的 V4 將催生更強大的 AI 智能體。報告觀察到,像阿里通義千問 App 等已經能夠以更自動化的方式執行多步驟任務,AI 智能體正從"對話工具"轉型為能處理複雜任務的"AI 助手"。 這些能執行多任務的智能體需要更頻繁地與底層大模型交互,將消耗更多 Token,進而推高算力需求。**因此模型效能的提升不僅不會"殺死軟件",反而為領先的軟件公司創造了價值。**野村強調,需要關注那些能率先利用新一代大模型能力打造出顛覆性 AI 原生應用或智能體的軟件公司。它們的增長天花板可能因模型能力的飛躍而被再次推高。 ### 相關股票 - [深度求索 (DPSK.NA)](https://longbridge.com/zh-HK/quote/DPSK.NA.md) - [國泰中證計算機主題ETF (512720.CN)](https://longbridge.com/zh-HK/quote/512720.CN.md) - [天弘中證計算機主題ETF (159998.CN)](https://longbridge.com/zh-HK/quote/159998.CN.md) - [全球科技股指數 ETF - iShares (IXN.US)](https://longbridge.com/zh-HK/quote/IXN.US.md) - [納斯達克 NexGen 經濟 ETF - Reality Shares (BLCN.US)](https://longbridge.com/zh-HK/quote/BLCN.US.md) - [國聯安科創芯片設計ETF (588780.CN)](https://longbridge.com/zh-HK/quote/588780.CN.md) ## 相關資訊與研究 - [內地 GenAI 用户逾 6 億 普及率 43%](https://longbridge.com/zh-HK/news/277665186.md) - [商湯推出「可編輯」AI PPT,可針對指定頁面手動修改](https://longbridge.com/zh-HK/news/277743083.md) - [09:05 ETJosys 通過人工智能驅動的身份治理平台實現自主 IT 運營](https://longbridge.com/zh-HK/news/277635290.md) - [首度走出國際市場,2 億像素與 400mm 增距鏡,vivo X300 Ultra 登陸 MWC!](https://longbridge.com/zh-HK/news/277559730.md) - [晶彩科公告自結元月 EPS 0.52 元](https://longbridge.com/zh-HK/news/277580331.md)