---
title: "梁文鋒被曝史上首次融資！DeepSeek V4 徹底擺脱英偉達"
type: "News"
locale: "zh-HK"
url: "https://longbridge.com/zh-HK/news/283207520.md"
description: "DeepSeek 首次尋求外部融資，計劃以不低於 100 億美元的估值籌集至少 3 億美元，打破了其不融資的傳統。創始人梁文鋒希望通過融資增強公司的資金實力，以應對激烈的 AI 競爭。DeepSeek V4 的發佈已多次推遲，預計將採用萬億參數的 MoE 架構，提升算力和薪酬以吸引頂尖研究者。"
datetime: "2026-04-18T02:24:28.000Z"
locales:
  - [zh-CN](https://longbridge.com/zh-CN/news/283207520.md)
  - [en](https://longbridge.com/en/news/283207520.md)
  - [zh-HK](https://longbridge.com/zh-HK/news/283207520.md)
---

# 梁文鋒被曝史上首次融資！DeepSeek V4 徹底擺脱英偉達

今早，AI 圈都被這個消息震撼了。

外媒 The Information 曝出，DeepSeek 正尋求首次外部融資！

打破「從不融資」鐵律的 DeepSeek，這次尋求以不低於 100 億美元的估值，籌集至少 3 億美元的資金。

在極其燒錢的 AI 大模型開發競賽中，DeepSeek 也需要充實資金彈藥庫了。

## **曾經的 DeepSeek，堅決不融資**

對沖基金巨頭幻方量化旗下的 DeepSeek，在 R1 引起硅谷和華爾街軒然大波後，多次拒絕了國內頂級風投和科技巨頭的投資意向。

DeepSeek 這次選擇啓動融資，意味着梁文鋒終於做出了巨大的轉變。

此前，作為技術理想主義者的他，一直希望保持 DeepSeek 的獨立性，不受商業壓力的干擾。

上一次發佈新一代模型，還是在 2025 年 DeepSeek R1 爆火時。如今，DeepSeek 已經讓全行業等了一年半。

如果此次融資成功，DeepSeek 就可以擁有更多算力，同時還能開出更高薪酬，防止頂尖研究者流失。

不過，由於 DeepSeek「中國初創公司」的身份，一些美國風險投資人態度會比較謹慎。

DeepSeek V4 的發佈時間一再推遲，同時 AI 圈的競爭環境已經大變樣。

如今全球的各大頂尖模型都在快速迭代，中美兩國的科技巨頭們正憑藉財大氣粗的優勢不斷佔領高位。

或許，這種壓力終於促使 DeepSeek 轉變了融資策略。

## **V4，一場萬億參數的硬仗**

按照 The Information 的説法，V4 原定今年 2 月亮相，但已跳票多次。

路透在 4 月初給出的最新時間窗口是「未來幾周內」。

從目前已知信息來看，V4 的規模和野心遠超前代。

-   參數量躍升至萬億級別。

V4 採用 MoE 架構，總參數約 1 萬億，但每個 token 僅激活約 370 億參數，推理成本與 V3 持平。這個設計思路延續了 DeepSeek 一貫的效率優先哲學。

來源網絡的爆料圖

-   上下文窗口擴展到 100 萬 token。

V4 引入了一套名為 Engram 的條件記憶架構，實現了對超長上下文的恆定時間檢索。據內部測試，在 100 萬 token 長度下的信息召回率達到 97%，遠超 V3 在 128K 上下文時的表現。

-   原生多模態。

據 FT 報道，V4 將是 DeepSeek 首個原生多模態模型，支持文本、圖像和視頻生成。此前 DeepSeek 的模型一直以純文本為主，而其他旗艦模型早已擁抱多模態。

-   代碼能力大幅強化。

V4 從立項之初就以代碼生成為核心目標。內部 benchmark 顯示 SWE-bench 成績超過 80%，HumanEval 達到 90%。據稱 V4 能處理整個代碼倉庫級別的複雜 bug 修復，在長上下文代碼推理上的表現將超越 Claude 和 GPT 系列。

此外，還有爆料稱，V4 預計將分兩個版本發佈。

完整版超萬億參數，針對高級推理和複雜代碼任務優化，面向華為昇騰芯片；輕量版約 2000 億參數，面向通用對話和 API 服務，可在其他國產芯片上運行。

開源方面，V4 計劃以 Apache 2.0 協議開放權重，延續 DeepSeek 一貫的開源策略。

什麼時候能用上？多個信源指向 4 月底。

3 月 9 日，一個名為「V4 Lite」的版本曾短暫出現在 DeepSeek 平台上隨後被撤下。

4 月初，又有開發者發現 API 節點上出現了 V4 Lite 的測試版本，推理速度提升 30%，128K 上下文的信息召回率從 45% 跳到了 94%。

DeepSeek 近日還在內蒙古烏蘭察布發佈了服務器運維工程師和交付經理的招聘崗位，這是該公司首次公開招聘算力基礎設施相關的駐場人員。

種種跡象表明，V4 已經不在實驗室裏了，而是在為大規模部署做最後準備。

## **老黃最不想看到的事正在發生**

V4 延期的核心原因，跟模型本身關係不大。真正的難點，是一場底層硬件的大遷移。

DeepSeek 之前所有模型都基於英偉達芯片訓練。但 V4 走了一條不同的路。

據路透報道，V4 將運行在華為最新的昇騰芯片上。

DeepSeek 的工程師們花了大量時間解決 V4 對華為芯片的適配問題，重寫核心代碼，從英偉達的 CUDA 生態遷移到華為的 CANN 架構。

這是一個技術決策，也是一個戰略信號。

DeepSeek 刻意沒有給英偉達和 AMD 提前提供 V4 做優化適配，而是將早期訪問權限獨家給了國產芯片廠商。

如果 V4 在華為芯片上跑出有競爭力的性能，它將是全球第一個不依賴英偉達的前沿 AI 模型。

老黃本人對此也不淡定。

他在近期採訪中直言，DeepSeek 基於華為平台的新模型「對美國來説將是一個糟糕的結果」。

言下之意是，一旦 AI 模型被優化為在中國硬件上跑得最好，美國芯片的護城河就不再牢固。

## **3 億美元，脱離英偉達生態？**

如今，即便是以「花小錢辦大事」著稱的 DeepSeek，也無法僅靠一家持續輸血。

據斯坦福大學 2026 年度 AI 指數報告，截至今年 3 月，美國頂級模型與中國最強競品之間的性能差距僅剩 2.7 個百分點。差距越小，每一步追趕的邊際成本越高。

就在本月，OpenAI 剛以 3000 億美元估值完成 400 億美元融資，相比之下，3 億美元也算不得天文數字。

V4 真正的賭注，在於它要證明前沿 AI 可以完全脱離英偉達生態獨立運轉。

3 億美元，押的就是這一把。

風險提示及免責條款

市場有風險，投資需謹慎。本文不構成個人投資建議，也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資，責任自負。

### 相關股票

- [NVDA.US](https://longbridge.com/zh-HK/quote/NVDA.US.md)
- [IGV.US](https://longbridge.com/zh-HK/quote/IGV.US.md)
- [NVDU.US](https://longbridge.com/zh-HK/quote/NVDU.US.md)
- [XLK.US](https://longbridge.com/zh-HK/quote/XLK.US.md)
- [XSD.US](https://longbridge.com/zh-HK/quote/XSD.US.md)
- [NVDX.US](https://longbridge.com/zh-HK/quote/NVDX.US.md)
- [SOXL.US](https://longbridge.com/zh-HK/quote/SOXL.US.md)
- [NVDL.US](https://longbridge.com/zh-HK/quote/NVDL.US.md)
- [SMH.US](https://longbridge.com/zh-HK/quote/SMH.US.md)
- [PSI.US](https://longbridge.com/zh-HK/quote/PSI.US.md)
- [DPSK.NA](https://longbridge.com/zh-HK/quote/DPSK.NA.md)
- [OpenAI.NA](https://longbridge.com/zh-HK/quote/OpenAI.NA.md)
- [HUAWEI.NA](https://longbridge.com/zh-HK/quote/HUAWEI.NA.md)
- [AMD.US](https://longbridge.com/zh-HK/quote/AMD.US.md)
- [NVD.DE](https://longbridge.com/zh-HK/quote/NVD.DE.md)

## 相關資訊與研究

- [外媒指 DeepSeek 首次尋求融資  籌 3 億美元  押注脱離英偉達](https://longbridge.com/zh-HK/news/283215819.md)
- [挑戰輝達「推論運算」霸權 AI 晶片新創 Cerebras 捲土重來申請 IPO](https://longbridge.com/zh-HK/news/283210399.md)
- [黃仁勳：AI 不是核彈 不會摧毀所有工作](https://longbridge.com/zh-HK/news/282990525.md)
- [台達電、光寶是大客户！它切入 AI 伺服器 EPS 從 11 到 14 元，跨電動車、通訊等四領域，逢低能佈局？](https://longbridge.com/zh-HK/news/283166326.md)
- [黃仁勳稱 Mythos 模型的突破顯示美、中必須就安全使用 AI 展開對話](https://longbridge.com/zh-HK/news/283032296.md)