--- title: "成本僅為美國同類產品的兩成!中國 AI 模型的低成本路徑正在改寫行業邏輯" type: "News" locale: "zh-HK" url: "https://longbridge.com/zh-HK/news/290382404.md" description: "瑞銀研究顯示,中國 AI 模型憑藉參數規模較小及稀疏注意力機制等技術優勢,訓練成本不足美國同類產品的 10%,API 均價僅為 20% 左右。儘管價格低廉,其毛利率仍與美國同行持平(20%-40%),表明低價源於結構性成本優勢而非補貼。這一成本優勢正促使微軟等巨頭評估替換高價模型,可能重塑行業競爭格局。" datetime: "2026-06-22T04:06:14.000Z" locales: - [zh-CN](https://longbridge.com/zh-CN/news/290382404.md) - [en](https://longbridge.com/en/news/290382404.md) - [zh-HK](https://longbridge.com/zh-HK/news/290382404.md) --- # 成本僅為美國同類產品的兩成!中國 AI 模型的低成本路徑正在改寫行業邏輯 價格打到美國的五分之一,利潤率卻不輸對手——中國 AI 模型的成本優勢,正在逼近一個讓華爾街不得不重新定價的臨界點。 當企業開始因為 token 賬單失控而踩剎車,當微軟據報正在評估用 DeepSeek 替換 Copilot 中更貴的 OpenAI 和 Anthropic 模型,一個過去被市場長期忽視的問題正在浮出水面:中國 AI 模型的低價,究竟是補貼撐出來的虛火,還是真實的結構性優勢? 瑞銀半導體團隊近期發佈了一份深度研究,分析師 Sundeep Gantori 對中國主要 AI 模型的訓練與推理成本進行了系統性拆解。測算顯示,以 MiniMax 和智譜為例,中國模型的訓練成本不到 OpenAI 和 Anthropic 的 10%;API 均價低於美國同類產品的 20%;**但毛利率——這個最能説明"是否在虧本賣"的指標——卻與美國同行基本持平,約在 20%-40% 之間。** 這意味着中國模型的低價,不是靠燒錢換來的,而是結構性成本優勢的體現。 ## **價格差距從何而來:三層成本拆解** 理解這個價格差距,需要從訓練、推理、基礎設施三個層面分別來看。 **訓練階段**,中國模型的參數規模普遍小於美國對手。DeepSeek V4 的總參數量為 1.6 萬億,Kimi K2.6 約為 1 萬億,而學術論文估算 Claude Opus 4.6 和 GPT-5.5 的參數規模分別約為 10 萬億和 5 萬億。參數少,訓練計算量自然低。 但參數規模只是第一步。更關鍵的差異在於**稀疏注意力機制**的應用。傳統 Transformer 模型中,每個 token 需要與序列中所有其他 token 交互,計算量隨上下文長度呈平方級增長。稀疏注意力通過讓每個 token 只與部分相關 token 交互,大幅壓縮了長上下文訓練和推理的計算消耗。DeepSeek V3.2 採用了自研的稀疏注意力設計(DSA),V4 進一步在此基礎上加入上下文壓縮。 在計算精度上,中國模型也走在了前面。以 Nvidia B200 為例,從 BF16/FP16 切換到 FP8,理論吞吐量可以翻倍。DeepSeek-V3 率先引入 FP8 混合精度訓練框架,V4 更進一步採用了 FP4 量化感知訓練;百度 ERNIE 4.5/5.0、阿里 Qwen3.5 均已跟進。 **基礎設施層面**,中國的電力成本具有實質性優勢。美國主要數據中心州(伊利諾伊、佐治亞)的平均電價約為 7.9 美分/度,而中國可比地區約為 4.4 美分/度,低約 44%。反映到 GPU 租用價格上,美國市場 Nvidia H100 的租用成本約為 1.99-3.99 美元/GPU 小時,中國約為 1.3-2.1 美元/GPU 小時,低約 40%。 這三層疊加下來,中國模型的成本結構系統性低於美國同行,價格優勢因此具有可持續性。 ## **推理端:更激進的技術路徑** 如果説訓練端的成本優勢主要來自資源約束下的"被迫創新",推理端的優化則更像是主動為之。 中國模型在推理階段普遍採用**混合專家架構(MoE)**,並且比美國同行走得更遠。MoE 的核心邏輯是:模型不需要為每個 token 激活全部參數,而是隻激活其中一個子集("專家")。早期美國 MoE 模型如 GPT-4、Llama 4 Scout 通常激活約 15-30% 的總參數,而中國領先 MoE 模型通常只激活約 3-10%。DeepSeek 從 V3.2 到 V4 Pro,活躍參數比從約 5% 降至約 3%,但模型智能指數(AA Intelligence Index)反而從 42 升至 52。 **KV 緩存壓縮**是另一個關鍵槓桿。在多輪對話類的智能體任務中,緩存輸入成本約佔總推理成本的 70%。DeepSeek V4 引入了重度壓縮注意力(HCA)和壓縮稀疏注意力(CSA)技術,使 V4 在相同上下文長度(100 萬 token)下只需要 V3.2 約 10% 的 KV 緩存——這直接使 DeepSeek V4 Pro 的綜合成本比 V3 下降約 10%,儘管性能有了顯著提升。 在服務編排層面,**P/D 分離**(預填充與解碼分離)將推理過程中計算密集型和內存密集型兩個階段拆分到不同 GPU 池,避免相互干擾;持續批處理則讓 GPU 在請求完成後立即接入新請求,而非等待最慢的那個,顯著提升吞吐率。MiniMax 通過其端到端基礎設施團隊,實現了超過 75% 的 MFU(模型算力利用率),高於行業平均水平的 40-50%。 這些技術的疊加,使得推理成本持續壓縮,而毛利率仍能維持在合理水平。MiniMax M2.7 的毛利率超過 40%,與 Anthropic 2025 年約 40% 的 API 毛利率基本一致。 ## **性能差距正在快速收窄** 成本優勢要真正形成市場威脅,需要配合足夠的能力。這正是當前局面的關鍵變量。 根據 Artificial Analysis 的數據,2023 年中國前沿模型的綜合智能約為美國頂尖模型的 60%;到 2025 年,這一比例已上升至約 90%。 分領域來看,差距並不均勻: - 文本模型綜合智能:已接近 90% 水平 - AI 編程:中國領先模型(如 Qwen3.7-Max、DeepSeek V4-Pro)已可比肩美國上一代模型(如 Claude Opus 4.6),但仍落後於最新前沿模型 Claude Fable 5 和 GPT-5.5 - 多模態與視頻生成:全球前五名視頻生成模型中,有四個來自中國 研發投入的對比同樣鮮明。智譜和 MiniMax 2025 年的 R&D 支出分別約為 5 億和 3 億美元,合計約為 Anthropic R&D 支出的十分之一,相對 OpenAI 則更低。 這種以極低研發投入實現快速追趕的路徑,有兩個支撐。其一是**蒸餾技術**,讓小模型通過模仿強模型的輸出來提升能力,縮短訓練週期。但行業調研認為,蒸餾效果主要侷限於結果可驗證、流程可重複的任務,對需要複雜多步推理或底層架構支撐的能力提升效果有限。智譜在長程推理上的進展、MiniMax 在多模態上的能力,均超出了蒸餾所能解釋的範圍。 其二是**開源生態的集體槓桿效應**。當一家實驗室驗證了某種架構或訓練方法,其他實驗室可以直接在此基礎上迭代,而無需重複相同的大規模實驗。Kimi K2 和 GLM-5 採用了類似 DeepSeek 驗證過的 MLA 潛在注意力設計;DeepSeek V4 引入了 Moonshot AI/Kimi 的 Muon 優化器;Qwen3 和智譜 GLM-4.5 均採用了 DeepSeek 驗證的 GRPO 強化學習方案。這種"集體實驗、分散受益"的模式,使整個中國 AI 生態的 R&D 邊際成本系統性低於各自為戰的美國閉源模型。 ## **企業正在踩剎車,這對誰有利** 成本壓力已經從宏觀討論落地為具體的企業行為。 Uber 在 2026 年 4 月就用完了全年 AI 預算,隨後對員工個人 AI 工具的月度 token 消耗設置了 1500 美元上限。Walmart 限制了內部 AI 智能體的 token 使用量。Amazon 警告員工不要"為了用 AI 而用 AI",並關閉了助長無效使用的內部 AI-token 排行榜。軟件公司 Workato 在 Anthropic 從訂閲制切換到按 token 計費的第一天,支出直接翻了 7 倍——首席信息官 Carter Busse 直言:"我們創造了一個怪物。" OpenAI CEO 山姆·奧特曼今年也公開承認,成本已成為客户面臨的"巨大問題",而去年這個問題幾乎不存在。 根據 SiliconData 的 LLM Token 支出指數(以支出/使用量加權的平均 token 價格),今年 5 月之前該指數持續攀升,近期已出現明顯回落,可能反映企業正在從高端閉源模型轉向更經濟的替代品。諮詢公司 Entelligence 對 2444 家企業的調查顯示,企業 AI 編程支出中,只有 18% 最終轉化為生產輸出,其餘 82% 被 bug 修復、代碼重寫和審查延誤所消耗。 這種從"儘可能多用"到"每一分錢花得值"的轉變,是中國模型最直接的市場機遇所在。當採購決策從"選最強的"變成"選夠用且最便宜的",成本結構的差異就從技術話題變成了商業現實。 ## **全球 10 萬億美元市場的切入邏輯** 該行估算全球 AI 長期市場規模可能超過 10 萬億美元。邏輯鏈條並不複雜:全球 GDP 已超過 110 萬億美元,勞動收入佔比約 50-60%;若 AI 能替代或增強約 20% 的人類勞動與認知工作,可尋址市場即超過 10 萬億美元。 中國在這個市場上的位置,並非只能做價格戰工具。從 2019 年到 2025 年,美國累計訓練了 223 個大型 AI 系統,中國為 192 個,兩者遠超其他所有國家,約為排名第三的法國的 10 倍。在 Artificial Analysis 全球前 20 名模型榜單中,只有一個來自法國(Mistral),其餘全部來自美國或中國公司。 對於中國模型的全球擴張路徑,該行給出了三個場景: **成本主導場景**(類比光伏):若中國模型最終在能力上與全球頭部產品趨同,且 token 調用趨於同質化,競爭將主要由成本驅動。中國在光伏領域已建立超過 80% 的全球市佔率。這是樂觀上限。 **性價比場景**(類比電動車、智能手機、家電):中國模型在絕對智能上仍落後,但價格優勢明顯,在中高端以下的大量用量場景中獲取 30-50% 的全球份額。這是瑞銀的基準預期。 **性能或生態主導場景**(類比雲計算和操作系統):若美國前沿模型保持明顯能力領先,且 AI 深度嵌入企業工作流(通過 AI 智能體),競爭就會從單一模型定價轉向生態系統建設。在這種情況下,用户數據和工作流積累形成壁壘,中國模型的全球份額可能維持在個位數低段到 10% 以下。 瑞銀認為中間那條路——性價比場景——是更可能的基準,理由是需求將趨於分層:複雜、高價值任務仍會為頂尖模型支付溢價,而大量高頻、ROI 敏感的工作量將流向更便宜的替代品。 這一分層邏輯也在技術層面有支撐。隨着模型能力向網絡安全、自主工具使用等高風險領域延伸,頭部模型可能面臨越來越嚴格的訪問限制。Anthropic 的 Claude Mythos Preview 據報道已被限制在少數可信組織內使用,原因是其在網絡安全領域展示出的能力(包括識別主流操作系統和瀏覽器漏洞)引發了濫用風險擔憂。最強大的模型不一定對所有用户開放,這本身就會加速市場分層,併為成本更低的模型騰出空間。 地緣政治是這個邏輯鏈條中最大的不確定變量。美國政府已限制 Claude Fable 的海外訪問,高盛交易台負責人 Rich Privorotsky 將此定性為 AI 競爭"可能已進入地緣政治管控階段"的信號。但瑞銀認為這一風險可被分散,因為除美國以外,歐洲、亞洲、中東等地區目前均缺乏本地頭部基礎模型,這為中國模型的全球擴張留下了可觀的空間。 ## 高盛:定價權爭奪戰,低成本 AI 是刺激需求還是摧毀溢價? 瑞銀的判斷與高盛 One-Delta 交易台負責人 Rich Privorotsky 近期的市場分析形成了呼應。 Privorotsky 在報告中指出,AI 板塊正面臨兩股相互對立的力量:一方面是更廣泛的應用普及與算力需求上升,另一方面是代幣通縮加劇、貨幣化前景存疑以及股票供給持續擴大。他援引 OpenRouter 的實驗結果稱,由 Gemini 3 Flash、Kimi K2.6 和 DeepSeek V4 Pro 組成的模型組合,在基準測試中全面超越單獨運行的 GPT-5.5 和 Opus 4.8,並以約一半的成本將性能差距縮小至距 Fable 5 不足 1% 以內。 Privorotsky 將這一趨勢定性為"市場一直低估的方向"——AI 智能競賽的邏輯正在從"誰擁有最強的單一模型"轉向"誰能最有效地編排多個模型",開源生態系統的權重隨之上升。他將核心矛盾提煉為一個**"價值萬億的問題":"更低的智能成本,究竟創造的需求多,還是摧毀的定價權多?"** 看多邏輯在於:成本下降與訪問門檻降低,最終應推動代幣消耗量與算力需求同步擴張。看空邏輯則在於:這一趨勢加速了代幣通縮,並對現有模型經濟學的可持續性構成根本性質疑——而他認為,後者正獲得越來越多的市場關注。這一問題的答案,直接關係到當前 AI 板塊數萬億美元市值的合理性,也將深刻影響中國模型全球擴張的最終邊界。 風險提示及免責條款 市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。 ### 相關股票 - [MSFT.US](https://longbridge.com/zh-HK/quote/MSFT.US.md) - [MSFX.US](https://longbridge.com/zh-HK/quote/MSFX.US.md) - [MSFD.US](https://longbridge.com/zh-HK/quote/MSFD.US.md) - [MSFU.US](https://longbridge.com/zh-HK/quote/MSFU.US.md) - [MSFL.US](https://longbridge.com/zh-HK/quote/MSFL.US.md) - [MSFO.US](https://longbridge.com/zh-HK/quote/MSFO.US.md) - [MSFW.US](https://longbridge.com/zh-HK/quote/MSFW.US.md) - [MSFY.US](https://longbridge.com/zh-HK/quote/MSFY.US.md) - [MAGX.US](https://longbridge.com/zh-HK/quote/MAGX.US.md) - [OpenAI.NA](https://longbridge.com/zh-HK/quote/OpenAI.NA.md) - [UBS.US](https://longbridge.com/zh-HK/quote/UBS.US.md) - [00100.HK](https://longbridge.com/zh-HK/quote/00100.HK.md) - [02513.HK](https://longbridge.com/zh-HK/quote/02513.HK.md) - [UBER.US](https://longbridge.com/zh-HK/quote/UBER.US.md) - [WMT.US](https://longbridge.com/zh-HK/quote/WMT.US.md) - [AMZN.US](https://longbridge.com/zh-HK/quote/AMZN.US.md) - [GS.US](https://longbridge.com/zh-HK/quote/GS.US.md) - [W4VR.SG](https://longbridge.com/zh-HK/quote/W4VR.SG.md) ## 相關資訊與研究 - [微軟與 LinkedIn 報告指企業高層跟不上員工 AI 步伐 促重構業務流程](https://longbridge.com/zh-HK/news/290055520.md) - [投資者表示,不要押注微軟股票會下跌](https://longbridge.com/zh-HK/news/290221122.md) - [SparkLabs Taiwan x Google 推 AI 新創全球化加速計畫](https://longbridge.com/zh-HK/news/290374998.md) - [Meta 遭歐盟勒令開放 WhatsApp 給 OpenAI 等對手使用,Meta 將提出上訴](https://longbridge.com/zh-HK/news/290336722.md) - [AI 技術驅動記憶體需求激增,特斯拉強勁表現面臨市場挑戰與機遇](https://longbridge.com/zh-HK/news/290343613.md)