---
title: "瑞銀髮現：60% 已開始控制 AI 支出，企業轉向低成本模型與開源中國模型"
type: "News"
locale: "zh-HK"
url: "https://longbridge.com/zh-HK/news/290775028.md"
description: "瑞銀報告顯示，60% 企業已限制 AI 支出，通過為 Token 使用加設護欄進行成本治理。這導致高價前沿模型面臨降檔壓力，阿里 Qwen 等中國開源模型進入企業採購選項。雲廠商和硬件層受影響有限，軟件公司則需平衡預算壓縮與優化平台定位機會。"
datetime: "2026-06-25T04:32:56.000Z"
locales:
  - [zh-CN](https://longbridge.com/zh-CN/news/290775028.md)
  - [en](https://longbridge.com/en/news/290775028.md)
  - [zh-HK](https://longbridge.com/zh-HK/news/290775028.md)
---

# 瑞銀髮現：60% 已開始控制 AI 支出，企業轉向低成本模型與開源中國模型

AI 支出管理正在成為企業 IT 治理的新戰場。隨着 AI Agent 和代碼工具的普及，Token 賬單正式進入 CFO 視野，企業的應對方式正在重塑 AI 產業鏈的受益格局。

據追風交易台，瑞銀證券分析師 Karl Keirstead 團隊在 6 月 23 日發佈的 AI 研究報告中給出核心判斷：Token 支出優化的激增可能暫時拖累 AI 收入增長，但長期趨勢依然強勁。其前期調研顯示，**約 60% 的企業已以某種方式限制 AI 開支，核心動作是為 Token 使用加設護欄。**這一比例意味着，AI 支出的成本治理已從個別企業的自發行為演變為更廣泛的行業現象。

變化的直接影響正在傳導至產業鏈。高價前沿模型面臨降檔使用與開源替代的壓力，**中國開源模型——包括阿里 Qwen、DeepSeek、MiniMax、智譜 GLM 等——開始進入企業採購與部署選項，**一家大型全球銀行已在本地部署 Qwen 以平衡 Claude 等高端模型的使用。

雲廠商和硬件層所受衝擊相對有限，軟件公司則處於最為複雜的位置：既面臨客户預算壓縮，又有機會將自身定位為 Token 優化平台。

## 企業沒有停用 AI，只是開始看 Token 賬單

企業 AI 使用的早期階段以粗放為主要特徵——鼓勵員工儘量試用，優先追求採用率，成本紀律普遍較弱。隨着 AI Agent 和 AI Coding 工具的普及，Token 消耗從聊天機器人式的小流量演變為持續跑任務的大流量，"Token-maxxing"問題開始浮出水面。

從調研中可見具體案例的極端性：有公司年內 Token 預算被大量消耗，不得不將內部 AI 工具從 5 個收縮至 2 個；有企業在 AWS Bedrock 上出現單個用户單月花費 3.5 萬美元的情況；還有 DevOps 團隊成員每週 Token 用量達到配額的 100% 至 200%，但企業暫未明確干預。

這並非一個統一的"踩剎車"故事。部分企業因 AI 已深度嵌入產品工作流，目標不是少用 Token，而是提升每一美元的產出；還有企業將員工薪酬目標與 AI 使用掛鈎，CFO 的降本訴求與 CEO 的推廣目標之間形成張力。**Databricks CEO 對這一輪變化的描述是："這是一個大減速帶，不是小減速帶。"**

真正被壓縮的往往是 ROI 不清晰的使用場景。軟件工程師代碼產出提升、客服 AI Agent 帶來的呼叫量減少、研發流程提速，這些指標讓部分公司沒有動力強行限用，企業願意忍受高 Token 賬單的前提是 ROI 看得見。

## 模型路由讓高端模型從"默認項"變成"奢侈項"

Token 優化最重要的技術動作不是簡單限額，而是模型路由：將不同任務分配給不同模型，只有複雜推理、關鍵代碼和長上下文分析才調用最貴的模型。

價格差異是推動這一行為的直接驅動力。以 Anthropic 模型定價為例，Haiku 4.5 輸出價格為每百萬 Token 5 美元，Opus 4.5-4.8 為 25 美元，Fable/Mythos 5 則高達 50 美元——從最低端升至最高端，輸出 Token 價格相差 10 倍。這一價差使得"按任務選模型"具有顯著的成本意義。

更合理的計算維度是"每個成功結果的有效成本"：高端模型若能一次生成高質量結果，可能比低端模型反覆迭代更划算，但這也意味着高端模型必須持續證明自身溢價的合理性。以前將所有任務都提交給最強模型的團隊，現在開始追問：這個任務真的需要最大上下文窗口嗎？

微軟近期推出的 MAI 小語言模型也踩中了這一方向。MAI "Thinking"被描述為 350 億參數的中等規模模型，Code-1 則定位低端前沿模型，目標是為企業提供"夠用但更便宜"的選項。

## 中國開源模型進入企業成本曲線

降檔不只發生在同一家模型供應商內部。**企業正在更大規模地評估開源模型，尤其是來自中國的開源模型，包括阿里 Qwen、DeepSeek、MiniMax、智譜 GLM 以及 Moonshot 旗下的 Kimi。**

據描述的案例，一家大型全球銀行為管理 Token 支出，開始在本地部署 Qwen，以平衡 Claude 等高端模型的使用。本地化部署將成本結構從按 Token 付費轉變為本地硬件容量配置，同時規避了使用外部託管中國模型的合規風險。

雲平台已將上述模型納入標準菜單。AWS Bedrock 的模型選項中已包含 MiniMax、Kimi、Qwen、DeepSeek、GLM；微軟方面通過 Azure AI Foundry 提供 DeepSeek，並在多模型策略下持續評估不同模型的性能與成本組合。

對中國模型提供商而言，這是機會，但邊界同樣清晰。開源模型通常免費或低價，直接貨幣化空間有限，更現實的路徑可能類似 BMW 與阿里圍繞 Qwen 展開合作的項目模式。

## 雲和芯片受到的不是同一種壓力

模型層是此輪成本壓力的直接承壓點，雲和硬件層的衝擊則需繞道傳導。

AWS、Azure、Google Cloud 已是多模型平台，並未單押某一家前沿模型公司。客户從高價模型切換至小模型或開源模型，可能影響雲廠商的模型 API 收入增速，**但只要推理仍在雲上運行，算力需求便不會消失。企業越重視成本管理，反而越可能將模型選擇、部署、安全和計費統一託管至雲平台。**

對 GPU 雲和 AI 基礎設施定價權的影響是需要持續觀察的變量：若模型公司因客户價格敏感而下調每 Token 價格，雲算力是否仍具提價能力？這一問題已進入投資者討論，但當前算力供給仍然偏緊，AI 滲透仍處早期，訓練與推理需求並未因優化行為而中斷。

硬件層的判斷整體偏向樂觀。GB200/GB300 等新一代算力剛開始形成規模，基於這些芯片訓練和推理的模型有望帶來更好的 Token 經濟性。音頻、視頻、物理 AI 等多模態數據流需求仍在持續擴展算力邊界。

## 軟件公司：預算壓力與"優化器"機會並存

AI Token 支出上升後，企業預算並非可以無限擴張。目前可觀察到的幾個資金來源方向包括：放緩招聘、減少外部 IT 服務支出、壓縮 SaaS 和應用軟件預算增長。

Uber 的例子具有代表性：AI 使用繼續推進，但通過放緩內部人員增長來抵消 Token 成本。這一框架也被用來解讀 IT 服務公司和部分 SaaS 公司的疲弱表現。

大型席位制 SaaS 公司處境尤為複雜。Salesforce、ServiceNow、Workday 等公司一方面面對客户預算重排，另一方面仍在推動從席位收費向"席位加使用量"的計費模式過渡——而當客户剛剛被 AI 賬單衝擊時，接受另一個使用量計費模型的意願明顯下降。

但軟件公司也有一張反牌。Palantir 約一個月前商業化 AIP Evolve，幫助客户選擇最適合任務的模型、調優 Prompt、改善數據調用。據披露，Evolve 在一個案例中推薦更換模型後，Token 成本下降 97%，上線前三週採用率達到 90%。

軟件公司的結構性優勢在於"不綁定單一模型"——可將自身定位為模型中立的調度平台，在 Claude、Qwen、Llama 及各類小模型之間為客户做成本與性能調度，邏輯與多雲數據庫公司類似。

## AI 增長邏輯未變，斜率之爭才剛開始

當前最難量化的變量是 Token 增速究竟會被壓低多少。許多企業自身尚未完全摸清 Token 花在哪裏，可靠的全行業數據更加稀缺。

**一個較為保守的路徑假設是：若某企業原本 AI Token 支出為 100，且預計數月後增長至 150，優化後實際可能落在 120 至 130 區間，而非倒退至 80。也就是説，增速被壓低，而非需求逆轉。**

瑞銀旗下 Evidence Lab 對約 130 家企業的最新調查顯示，僅 8% 的企業已在生產環境中大規模部署 AI Agent，37% 是生產中有限規模使用，29% 仍在試點，26% 只是使用 Copilot 或 AI Coding 等產品但尚未部署 Agent 應用。AI Agent 真正大規模消耗 Token 的階段才剛開始。

頭部 AI 原生公司的數據印證了這一判斷。法律 AI 公司 Harvey 披露，其 Token 消耗從 1 月的 1 萬億增長至 5 月的 12 萬億至 13 萬億，説明優化與擴張可以同時發生：企業會更精細地分配支出，但 AI 使用場景仍在持續向外擴展。

此輪 Token 優化與 2022 年至 2024 年後疫情時代雲與軟件的"預算回撤"存在本質差異：後者是成熟用量被砍，前者更接近新技術擴散早期的成本治理。其結果不是 AI 需求消失，而是重塑贏家排序——高價模型收入增速受壓，低成本模型和路由工具受益，雲平台繼續吃多模型部署需求，軟件公司則站在被砍預算與成為省錢工具的岔路口上。

\~~~~~~~~~~~~~~~~~~~~~~~~

以上精彩內容來自追風交易台。

更詳細的解讀，包括實時解讀、一線研究等內容，請加入【**追風交易台▪年度會員**】

風險提示及免責條款

市場有風險，投資需謹慎。本文不構成個人投資建議，也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資，責任自負。

### 相關股票

- [09988.HK](https://longbridge.com/zh-HK/quote/09988.HK.md)
- [BABA.US](https://longbridge.com/zh-HK/quote/BABA.US.md)
- [BABX.US](https://longbridge.com/zh-HK/quote/BABX.US.md)
- [KBAB.US](https://longbridge.com/zh-HK/quote/KBAB.US.md)
- [BABO.US](https://longbridge.com/zh-HK/quote/BABO.US.md)
- [BABU.US](https://longbridge.com/zh-HK/quote/BABU.US.md)
- [BABW.US](https://longbridge.com/zh-HK/quote/BABW.US.md)
- [BBYY.US](https://longbridge.com/zh-HK/quote/BBYY.US.md)
- [UBS.US](https://longbridge.com/zh-HK/quote/UBS.US.md)
- [01376.HK](https://longbridge.com/zh-HK/quote/01376.HK.md)
- [MSFT.US](https://longbridge.com/zh-HK/quote/MSFT.US.md)
- [BMWYY.US](https://longbridge.com/zh-HK/quote/BMWYY.US.md)
- [BMW.DE](https://longbridge.com/zh-HK/quote/BMW.DE.md)
- [CRM.US](https://longbridge.com/zh-HK/quote/CRM.US.md)
- [NOW.US](https://longbridge.com/zh-HK/quote/NOW.US.md)
- [WDAY.US](https://longbridge.com/zh-HK/quote/WDAY.US.md)
- [UBER.US](https://longbridge.com/zh-HK/quote/UBER.US.md)
- [PLTR.US](https://longbridge.com/zh-HK/quote/PLTR.US.md)
- [89988.HK](https://longbridge.com/zh-HK/quote/89988.HK.md)
- [HBBD.SG](https://longbridge.com/zh-HK/quote/HBBD.SG.md)
- [BMW3.DE](https://longbridge.com/zh-HK/quote/BMW3.DE.md)

## 相關資訊與研究

- [【AI】阿里雲 QoderWork 推出「峯谷 Token」，錯峯使用 Qwen3.7-Max 低至 2 折](https://longbridge.com/zh-HK/news/290649598.md)
- [阿里升級大模型組織架構，設 Token Foundry 事業](https://longbridge.com/zh-HK/news/289134394.md)
- [【AI】百度智能雲發布百度千帆 Token Plan 企業版，提供 GLM-5.2 等模型](https://longbridge.com/zh-HK/news/290762351.md)
- [陸媒：智譜開源模型用 1/6 的價格打爆美國 AI 護城河](https://longbridge.com/zh-HK/news/290839326.md)
- [和電香港推一系列 AI 創新產品及服務  指定 5G 計劃送 800 億 Token](https://longbridge.com/zh-HK/news/290010002.md)