---
title: "成本僅為美國同類產品的兩成！中國 AI 模型的低成本路徑正在改寫行業邏輯"
type: "News"
locale: "zh-HK"
url: "https://longbridge.com/zh-HK/news/290382404.md"
description: "瑞銀研究顯示，中國 AI 模型憑藉參數規模較小及稀疏注意力機制等技術優勢，訓練成本不足美國同類產品的 10%，API 均價僅為 20% 左右。儘管價格低廉，其毛利率仍與美國同行持平（20%-40%），表明低價源於結構性成本優勢而非補貼。這一成本優勢正促使微軟等巨頭評估替換高價模型，可能重塑行業競爭格局。"
datetime: "2026-06-22T04:06:14.000Z"
locales:
  - [zh-CN](https://longbridge.com/zh-CN/news/290382404.md)
  - [en](https://longbridge.com/en/news/290382404.md)
  - [zh-HK](https://longbridge.com/zh-HK/news/290382404.md)
---

# 成本僅為美國同類產品的兩成！中國 AI 模型的低成本路徑正在改寫行業邏輯

價格打到美國的五分之一，利潤率卻不輸對手——中國 AI 模型的成本優勢，正在逼近一個讓華爾街不得不重新定價的臨界點。

當企業開始因為 token 賬單失控而踩剎車，當微軟據報正在評估用 DeepSeek 替換 Copilot 中更貴的 OpenAI 和 Anthropic 模型，一個過去被市場長期忽視的問題正在浮出水面：中國 AI 模型的低價，究竟是補貼撐出來的虛火，還是真實的結構性優勢？

瑞銀半導體團隊近期發佈了一份深度研究，分析師 Sundeep Gantori 對中國主要 AI 模型的訓練與推理成本進行了系統性拆解。測算顯示，以 MiniMax 和智譜為例，中國模型的訓練成本不到 OpenAI 和 Anthropic 的 10%；API 均價低於美國同類產品的 20%；**但毛利率——這個最能説明"是否在虧本賣"的指標——卻與美國同行基本持平，約在 20%-40% 之間。**

這意味着中國模型的低價，不是靠燒錢換來的，而是結構性成本優勢的體現。

## **價格差距從何而來：三層成本拆解**

理解這個價格差距，需要從訓練、推理、基礎設施三個層面分別來看。

**訓練階段**，中國模型的參數規模普遍小於美國對手。DeepSeek V4 的總參數量為 1.6 萬億，Kimi K2.6 約為 1 萬億，而學術論文估算 Claude Opus 4.6 和 GPT-5.5 的參數規模分別約為 10 萬億和 5 萬億。參數少，訓練計算量自然低。

但參數規模只是第一步。更關鍵的差異在於**稀疏注意力機制**的應用。傳統 Transformer 模型中，每個 token 需要與序列中所有其他 token 交互，計算量隨上下文長度呈平方級增長。稀疏注意力通過讓每個 token 只與部分相關 token 交互，大幅壓縮了長上下文訓練和推理的計算消耗。DeepSeek V3.2 採用了自研的稀疏注意力設計（DSA），V4 進一步在此基礎上加入上下文壓縮。

在計算精度上，中國模型也走在了前面。以 Nvidia B200 為例，從 BF16/FP16 切換到 FP8，理論吞吐量可以翻倍。DeepSeek-V3 率先引入 FP8 混合精度訓練框架，V4 更進一步採用了 FP4 量化感知訓練；百度 ERNIE 4.5/5.0、阿里 Qwen3.5 均已跟進。

**基礎設施層面**，中國的電力成本具有實質性優勢。美國主要數據中心州（伊利諾伊、佐治亞）的平均電價約為 7.9 美分/度，而中國可比地區約為 4.4 美分/度，低約 44%。反映到 GPU 租用價格上，美國市場 Nvidia H100 的租用成本約為 1.99-3.99 美元/GPU 小時，中國約為 1.3-2.1 美元/GPU 小時，低約 40%。

這三層疊加下來，中國模型的成本結構系統性低於美國同行，價格優勢因此具有可持續性。

## **推理端：更激進的技術路徑**

如果説訓練端的成本優勢主要來自資源約束下的"被迫創新"，推理端的優化則更像是主動為之。

中國模型在推理階段普遍採用**混合專家架構（MoE）**，並且比美國同行走得更遠。MoE 的核心邏輯是：模型不需要為每個 token 激活全部參數，而是隻激活其中一個子集（"專家"）。早期美國 MoE 模型如 GPT-4、Llama 4 Scout 通常激活約 15-30% 的總參數，而中國領先 MoE 模型通常只激活約 3-10%。DeepSeek 從 V3.2 到 V4 Pro，活躍參數比從約 5% 降至約 3%，但模型智能指數（AA Intelligence Index）反而從 42 升至 52。

**KV 緩存壓縮**是另一個關鍵槓桿。在多輪對話類的智能體任務中，緩存輸入成本約佔總推理成本的 70%。DeepSeek V4 引入了重度壓縮注意力（HCA）和壓縮稀疏注意力（CSA）技術，使 V4 在相同上下文長度（100 萬 token）下只需要 V3.2 約 10% 的 KV 緩存——這直接使 DeepSeek V4 Pro 的綜合成本比 V3 下降約 10%，儘管性能有了顯著提升。

在服務編排層面，**P/D 分離**（預填充與解碼分離）將推理過程中計算密集型和內存密集型兩個階段拆分到不同 GPU 池，避免相互干擾；持續批處理則讓 GPU 在請求完成後立即接入新請求，而非等待最慢的那個，顯著提升吞吐率。MiniMax 通過其端到端基礎設施團隊，實現了超過 75% 的 MFU（模型算力利用率），高於行業平均水平的 40-50%。

這些技術的疊加，使得推理成本持續壓縮，而毛利率仍能維持在合理水平。MiniMax M2.7 的毛利率超過 40%，與 Anthropic 2025 年約 40% 的 API 毛利率基本一致。

## **性能差距正在快速收窄**

成本優勢要真正形成市場威脅，需要配合足夠的能力。這正是當前局面的關鍵變量。

根據 Artificial Analysis 的數據，2023 年中國前沿模型的綜合智能約為美國頂尖模型的 60%；到 2025 年，這一比例已上升至約 90%。

分領域來看，差距並不均勻：

-   文本模型綜合智能：已接近 90% 水平
-   AI 編程：中國領先模型（如 Qwen3.7-Max、DeepSeek V4-Pro）已可比肩美國上一代模型（如 Claude Opus 4.6），但仍落後於最新前沿模型 Claude Fable 5 和 GPT-5.5
-   多模態與視頻生成：全球前五名視頻生成模型中，有四個來自中國

研發投入的對比同樣鮮明。智譜和 MiniMax 2025 年的 R&D 支出分別約為 5 億和 3 億美元，合計約為 Anthropic R&D 支出的十分之一，相對 OpenAI 則更低。

這種以極低研發投入實現快速追趕的路徑，有兩個支撐。其一是**蒸餾技術**，讓小模型通過模仿強模型的輸出來提升能力，縮短訓練週期。但行業調研認為，蒸餾效果主要侷限於結果可驗證、流程可重複的任務，對需要複雜多步推理或底層架構支撐的能力提升效果有限。智譜在長程推理上的進展、MiniMax 在多模態上的能力，均超出了蒸餾所能解釋的範圍。

其二是**開源生態的集體槓桿效應**。當一家實驗室驗證了某種架構或訓練方法，其他實驗室可以直接在此基礎上迭代，而無需重複相同的大規模實驗。Kimi K2 和 GLM-5 採用了類似 DeepSeek 驗證過的 MLA 潛在注意力設計；DeepSeek V4 引入了 Moonshot AI/Kimi 的 Muon 優化器；Qwen3 和智譜 GLM-4.5 均採用了 DeepSeek 驗證的 GRPO 強化學習方案。這種"集體實驗、分散受益"的模式，使整個中國 AI 生態的 R&D 邊際成本系統性低於各自為戰的美國閉源模型。

## **企業正在踩剎車，這對誰有利**

成本壓力已經從宏觀討論落地為具體的企業行為。

Uber 在 2026 年 4 月就用完了全年 AI 預算，隨後對員工個人 AI 工具的月度 token 消耗設置了 1500 美元上限。Walmart 限制了內部 AI 智能體的 token 使用量。Amazon 警告員工不要"為了用 AI 而用 AI"，並關閉了助長無效使用的內部 AI-token 排行榜。軟件公司 Workato 在 Anthropic 從訂閲制切換到按 token 計費的第一天，支出直接翻了 7 倍——首席信息官 Carter Busse 直言："我們創造了一個怪物。"

OpenAI CEO 山姆·奧特曼今年也公開承認，成本已成為客户面臨的"巨大問題"，而去年這個問題幾乎不存在。

根據 SiliconData 的 LLM Token 支出指數（以支出/使用量加權的平均 token 價格），今年 5 月之前該指數持續攀升，近期已出現明顯回落，可能反映企業正在從高端閉源模型轉向更經濟的替代品。諮詢公司 Entelligence 對 2444 家企業的調查顯示，企業 AI 編程支出中，只有 18% 最終轉化為生產輸出，其餘 82% 被 bug 修復、代碼重寫和審查延誤所消耗。

這種從"儘可能多用"到"每一分錢花得值"的轉變，是中國模型最直接的市場機遇所在。當採購決策從"選最強的"變成"選夠用且最便宜的"，成本結構的差異就從技術話題變成了商業現實。

## **全球 10 萬億美元市場的切入邏輯**

該行估算全球 AI 長期市場規模可能超過 10 萬億美元。邏輯鏈條並不複雜：全球 GDP 已超過 110 萬億美元，勞動收入佔比約 50-60%；若 AI 能替代或增強約 20% 的人類勞動與認知工作，可尋址市場即超過 10 萬億美元。

中國在這個市場上的位置，並非只能做價格戰工具。從 2019 年到 2025 年，美國累計訓練了 223 個大型 AI 系統，中國為 192 個，兩者遠超其他所有國家，約為排名第三的法國的 10 倍。在 Artificial Analysis 全球前 20 名模型榜單中，只有一個來自法國（Mistral），其餘全部來自美國或中國公司。

對於中國模型的全球擴張路徑，該行給出了三個場景：

**成本主導場景**（類比光伏）：若中國模型最終在能力上與全球頭部產品趨同，且 token 調用趨於同質化，競爭將主要由成本驅動。中國在光伏領域已建立超過 80% 的全球市佔率。這是樂觀上限。

**性價比場景**（類比電動車、智能手機、家電）：中國模型在絕對智能上仍落後，但價格優勢明顯，在中高端以下的大量用量場景中獲取 30-50% 的全球份額。這是瑞銀的基準預期。

**性能或生態主導場景**（類比雲計算和操作系統）：若美國前沿模型保持明顯能力領先，且 AI 深度嵌入企業工作流（通過 AI 智能體），競爭就會從單一模型定價轉向生態系統建設。在這種情況下，用户數據和工作流積累形成壁壘，中國模型的全球份額可能維持在個位數低段到 10% 以下。

瑞銀認為中間那條路——性價比場景——是更可能的基準，理由是需求將趨於分層：複雜、高價值任務仍會為頂尖模型支付溢價，而大量高頻、ROI 敏感的工作量將流向更便宜的替代品。

這一分層邏輯也在技術層面有支撐。隨着模型能力向網絡安全、自主工具使用等高風險領域延伸，頭部模型可能面臨越來越嚴格的訪問限制。Anthropic 的 Claude Mythos Preview 據報道已被限制在少數可信組織內使用，原因是其在網絡安全領域展示出的能力（包括識別主流操作系統和瀏覽器漏洞）引發了濫用風險擔憂。最強大的模型不一定對所有用户開放，這本身就會加速市場分層，併為成本更低的模型騰出空間。

地緣政治是這個邏輯鏈條中最大的不確定變量。美國政府已限制 Claude Fable 的海外訪問，高盛交易台負責人 Rich Privorotsky 將此定性為 AI 競爭"可能已進入地緣政治管控階段"的信號。但瑞銀認為這一風險可被分散，因為除美國以外，歐洲、亞洲、中東等地區目前均缺乏本地頭部基礎模型，這為中國模型的全球擴張留下了可觀的空間。

## 高盛：定價權爭奪戰，低成本 AI 是刺激需求還是摧毀溢價？

瑞銀的判斷與高盛 One-Delta 交易台負責人 Rich Privorotsky 近期的市場分析形成了呼應。

Privorotsky 在報告中指出，AI 板塊正面臨兩股相互對立的力量：一方面是更廣泛的應用普及與算力需求上升，另一方面是代幣通縮加劇、貨幣化前景存疑以及股票供給持續擴大。他援引 OpenRouter 的實驗結果稱，由 Gemini 3 Flash、Kimi K2.6 和 DeepSeek V4 Pro 組成的模型組合，在基準測試中全面超越單獨運行的 GPT-5.5 和 Opus 4.8，並以約一半的成本將性能差距縮小至距 Fable 5 不足 1% 以內。

Privorotsky 將這一趨勢定性為"市場一直低估的方向"——AI 智能競賽的邏輯正在從"誰擁有最強的單一模型"轉向"誰能最有效地編排多個模型"，開源生態系統的權重隨之上升。他將核心矛盾提煉為一個**"價值萬億的問題"："更低的智能成本，究竟創造的需求多，還是摧毀的定價權多？"**

看多邏輯在於：成本下降與訪問門檻降低，最終應推動代幣消耗量與算力需求同步擴張。看空邏輯則在於：這一趨勢加速了代幣通縮，並對現有模型經濟學的可持續性構成根本性質疑——而他認為，後者正獲得越來越多的市場關注。這一問題的答案，直接關係到當前 AI 板塊數萬億美元市值的合理性，也將深刻影響中國模型全球擴張的最終邊界。

風險提示及免責條款

市場有風險，投資需謹慎。本文不構成個人投資建議，也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資，責任自負。

### 相關股票

- [MSFT.US](https://longbridge.com/zh-HK/quote/MSFT.US.md)
- [MSFX.US](https://longbridge.com/zh-HK/quote/MSFX.US.md)
- [MSFD.US](https://longbridge.com/zh-HK/quote/MSFD.US.md)
- [MSFU.US](https://longbridge.com/zh-HK/quote/MSFU.US.md)
- [MSFL.US](https://longbridge.com/zh-HK/quote/MSFL.US.md)
- [MSFO.US](https://longbridge.com/zh-HK/quote/MSFO.US.md)
- [MSFW.US](https://longbridge.com/zh-HK/quote/MSFW.US.md)
- [MSFY.US](https://longbridge.com/zh-HK/quote/MSFY.US.md)
- [MAGX.US](https://longbridge.com/zh-HK/quote/MAGX.US.md)
- [OpenAI.NA](https://longbridge.com/zh-HK/quote/OpenAI.NA.md)
- [UBS.US](https://longbridge.com/zh-HK/quote/UBS.US.md)
- [00100.HK](https://longbridge.com/zh-HK/quote/00100.HK.md)
- [02513.HK](https://longbridge.com/zh-HK/quote/02513.HK.md)
- [UBER.US](https://longbridge.com/zh-HK/quote/UBER.US.md)
- [WMT.US](https://longbridge.com/zh-HK/quote/WMT.US.md)
- [AMZN.US](https://longbridge.com/zh-HK/quote/AMZN.US.md)
- [GS.US](https://longbridge.com/zh-HK/quote/GS.US.md)
- [W4VR.SG](https://longbridge.com/zh-HK/quote/W4VR.SG.md)

## 相關資訊與研究

- [微軟與 LinkedIn 報告指企業高層跟不上員工 AI 步伐 促重構業務流程](https://longbridge.com/zh-HK/news/290055520.md)
- [投資者表示，不要押注微軟股票會下跌](https://longbridge.com/zh-HK/news/290221122.md)
- [SparkLabs Taiwan x Google 推 AI 新創全球化加速計畫](https://longbridge.com/zh-HK/news/290374998.md)
- [Meta 遭歐盟勒令開放 WhatsApp 給 OpenAI 等對手使用，Meta 將提出上訴](https://longbridge.com/zh-HK/news/290336722.md)
- [AI 技術驅動記憶體需求激增，特斯拉強勁表現面臨市場挑戰與機遇](https://longbridge.com/zh-HK/news/290343613.md)