--- title: "瑞銀髮現:60% 已開始控制 AI 支出,企業轉向低成本模型與開源中國模型" type: "News" locale: "zh-HK" url: "https://longbridge.com/zh-HK/news/290775028.md" description: "瑞銀報告顯示,60% 企業已限制 AI 支出,通過為 Token 使用加設護欄進行成本治理。這導致高價前沿模型面臨降檔壓力,阿里 Qwen 等中國開源模型進入企業採購選項。雲廠商和硬件層受影響有限,軟件公司則需平衡預算壓縮與優化平台定位機會。" datetime: "2026-06-25T04:32:56.000Z" locales: - [zh-CN](https://longbridge.com/zh-CN/news/290775028.md) - [en](https://longbridge.com/en/news/290775028.md) - [zh-HK](https://longbridge.com/zh-HK/news/290775028.md) --- # 瑞銀髮現:60% 已開始控制 AI 支出,企業轉向低成本模型與開源中國模型 AI 支出管理正在成為企業 IT 治理的新戰場。隨着 AI Agent 和代碼工具的普及,Token 賬單正式進入 CFO 視野,企業的應對方式正在重塑 AI 產業鏈的受益格局。 據追風交易台,瑞銀證券分析師 Karl Keirstead 團隊在 6 月 23 日發佈的 AI 研究報告中給出核心判斷:Token 支出優化的激增可能暫時拖累 AI 收入增長,但長期趨勢依然強勁。其前期調研顯示,**約 60% 的企業已以某種方式限制 AI 開支,核心動作是為 Token 使用加設護欄。**這一比例意味着,AI 支出的成本治理已從個別企業的自發行為演變為更廣泛的行業現象。 變化的直接影響正在傳導至產業鏈。高價前沿模型面臨降檔使用與開源替代的壓力,**中國開源模型——包括阿里 Qwen、DeepSeek、MiniMax、智譜 GLM 等——開始進入企業採購與部署選項,**一家大型全球銀行已在本地部署 Qwen 以平衡 Claude 等高端模型的使用。 雲廠商和硬件層所受衝擊相對有限,軟件公司則處於最為複雜的位置:既面臨客户預算壓縮,又有機會將自身定位為 Token 優化平台。 ## 企業沒有停用 AI,只是開始看 Token 賬單 企業 AI 使用的早期階段以粗放為主要特徵——鼓勵員工儘量試用,優先追求採用率,成本紀律普遍較弱。隨着 AI Agent 和 AI Coding 工具的普及,Token 消耗從聊天機器人式的小流量演變為持續跑任務的大流量,"Token-maxxing"問題開始浮出水面。 從調研中可見具體案例的極端性:有公司年內 Token 預算被大量消耗,不得不將內部 AI 工具從 5 個收縮至 2 個;有企業在 AWS Bedrock 上出現單個用户單月花費 3.5 萬美元的情況;還有 DevOps 團隊成員每週 Token 用量達到配額的 100% 至 200%,但企業暫未明確干預。 這並非一個統一的"踩剎車"故事。部分企業因 AI 已深度嵌入產品工作流,目標不是少用 Token,而是提升每一美元的產出;還有企業將員工薪酬目標與 AI 使用掛鈎,CFO 的降本訴求與 CEO 的推廣目標之間形成張力。**Databricks CEO 對這一輪變化的描述是:"這是一個大減速帶,不是小減速帶。"** 真正被壓縮的往往是 ROI 不清晰的使用場景。軟件工程師代碼產出提升、客服 AI Agent 帶來的呼叫量減少、研發流程提速,這些指標讓部分公司沒有動力強行限用,企業願意忍受高 Token 賬單的前提是 ROI 看得見。 ## 模型路由讓高端模型從"默認項"變成"奢侈項" Token 優化最重要的技術動作不是簡單限額,而是模型路由:將不同任務分配給不同模型,只有複雜推理、關鍵代碼和長上下文分析才調用最貴的模型。 價格差異是推動這一行為的直接驅動力。以 Anthropic 模型定價為例,Haiku 4.5 輸出價格為每百萬 Token 5 美元,Opus 4.5-4.8 為 25 美元,Fable/Mythos 5 則高達 50 美元——從最低端升至最高端,輸出 Token 價格相差 10 倍。這一價差使得"按任務選模型"具有顯著的成本意義。 更合理的計算維度是"每個成功結果的有效成本":高端模型若能一次生成高質量結果,可能比低端模型反覆迭代更划算,但這也意味着高端模型必須持續證明自身溢價的合理性。以前將所有任務都提交給最強模型的團隊,現在開始追問:這個任務真的需要最大上下文窗口嗎? 微軟近期推出的 MAI 小語言模型也踩中了這一方向。MAI "Thinking"被描述為 350 億參數的中等規模模型,Code-1 則定位低端前沿模型,目標是為企業提供"夠用但更便宜"的選項。 ## 中國開源模型進入企業成本曲線 降檔不只發生在同一家模型供應商內部。**企業正在更大規模地評估開源模型,尤其是來自中國的開源模型,包括阿里 Qwen、DeepSeek、MiniMax、智譜 GLM 以及 Moonshot 旗下的 Kimi。** 據描述的案例,一家大型全球銀行為管理 Token 支出,開始在本地部署 Qwen,以平衡 Claude 等高端模型的使用。本地化部署將成本結構從按 Token 付費轉變為本地硬件容量配置,同時規避了使用外部託管中國模型的合規風險。 雲平台已將上述模型納入標準菜單。AWS Bedrock 的模型選項中已包含 MiniMax、Kimi、Qwen、DeepSeek、GLM;微軟方面通過 Azure AI Foundry 提供 DeepSeek,並在多模型策略下持續評估不同模型的性能與成本組合。 對中國模型提供商而言,這是機會,但邊界同樣清晰。開源模型通常免費或低價,直接貨幣化空間有限,更現實的路徑可能類似 BMW 與阿里圍繞 Qwen 展開合作的項目模式。 ## 雲和芯片受到的不是同一種壓力 模型層是此輪成本壓力的直接承壓點,雲和硬件層的衝擊則需繞道傳導。 AWS、Azure、Google Cloud 已是多模型平台,並未單押某一家前沿模型公司。客户從高價模型切換至小模型或開源模型,可能影響雲廠商的模型 API 收入增速,**但只要推理仍在雲上運行,算力需求便不會消失。企業越重視成本管理,反而越可能將模型選擇、部署、安全和計費統一託管至雲平台。** 對 GPU 雲和 AI 基礎設施定價權的影響是需要持續觀察的變量:若模型公司因客户價格敏感而下調每 Token 價格,雲算力是否仍具提價能力?這一問題已進入投資者討論,但當前算力供給仍然偏緊,AI 滲透仍處早期,訓練與推理需求並未因優化行為而中斷。 硬件層的判斷整體偏向樂觀。GB200/GB300 等新一代算力剛開始形成規模,基於這些芯片訓練和推理的模型有望帶來更好的 Token 經濟性。音頻、視頻、物理 AI 等多模態數據流需求仍在持續擴展算力邊界。 ## 軟件公司:預算壓力與"優化器"機會並存 AI Token 支出上升後,企業預算並非可以無限擴張。目前可觀察到的幾個資金來源方向包括:放緩招聘、減少外部 IT 服務支出、壓縮 SaaS 和應用軟件預算增長。 Uber 的例子具有代表性:AI 使用繼續推進,但通過放緩內部人員增長來抵消 Token 成本。這一框架也被用來解讀 IT 服務公司和部分 SaaS 公司的疲弱表現。 大型席位制 SaaS 公司處境尤為複雜。Salesforce、ServiceNow、Workday 等公司一方面面對客户預算重排,另一方面仍在推動從席位收費向"席位加使用量"的計費模式過渡——而當客户剛剛被 AI 賬單衝擊時,接受另一個使用量計費模型的意願明顯下降。 但軟件公司也有一張反牌。Palantir 約一個月前商業化 AIP Evolve,幫助客户選擇最適合任務的模型、調優 Prompt、改善數據調用。據披露,Evolve 在一個案例中推薦更換模型後,Token 成本下降 97%,上線前三週採用率達到 90%。 軟件公司的結構性優勢在於"不綁定單一模型"——可將自身定位為模型中立的調度平台,在 Claude、Qwen、Llama 及各類小模型之間為客户做成本與性能調度,邏輯與多雲數據庫公司類似。 ## AI 增長邏輯未變,斜率之爭才剛開始 當前最難量化的變量是 Token 增速究竟會被壓低多少。許多企業自身尚未完全摸清 Token 花在哪裏,可靠的全行業數據更加稀缺。 **一個較為保守的路徑假設是:若某企業原本 AI Token 支出為 100,且預計數月後增長至 150,優化後實際可能落在 120 至 130 區間,而非倒退至 80。也就是説,增速被壓低,而非需求逆轉。** 瑞銀旗下 Evidence Lab 對約 130 家企業的最新調查顯示,僅 8% 的企業已在生產環境中大規模部署 AI Agent,37% 是生產中有限規模使用,29% 仍在試點,26% 只是使用 Copilot 或 AI Coding 等產品但尚未部署 Agent 應用。AI Agent 真正大規模消耗 Token 的階段才剛開始。 頭部 AI 原生公司的數據印證了這一判斷。法律 AI 公司 Harvey 披露,其 Token 消耗從 1 月的 1 萬億增長至 5 月的 12 萬億至 13 萬億,説明優化與擴張可以同時發生:企業會更精細地分配支出,但 AI 使用場景仍在持續向外擴展。 此輪 Token 優化與 2022 年至 2024 年後疫情時代雲與軟件的"預算回撤"存在本質差異:後者是成熟用量被砍,前者更接近新技術擴散早期的成本治理。其結果不是 AI 需求消失,而是重塑贏家排序——高價模型收入增速受壓,低成本模型和路由工具受益,雲平台繼續吃多模型部署需求,軟件公司則站在被砍預算與成為省錢工具的岔路口上。 \~~~~~~~~~~~~~~~~~~~~~~~~ 以上精彩內容來自追風交易台。 更詳細的解讀,包括實時解讀、一線研究等內容,請加入【**追風交易台▪年度會員**】 風險提示及免責條款 市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。 ### 相關股票 - [09988.HK](https://longbridge.com/zh-HK/quote/09988.HK.md) - [BABA.US](https://longbridge.com/zh-HK/quote/BABA.US.md) - [BABX.US](https://longbridge.com/zh-HK/quote/BABX.US.md) - [KBAB.US](https://longbridge.com/zh-HK/quote/KBAB.US.md) - [BABO.US](https://longbridge.com/zh-HK/quote/BABO.US.md) - [BABU.US](https://longbridge.com/zh-HK/quote/BABU.US.md) - [BABW.US](https://longbridge.com/zh-HK/quote/BABW.US.md) - [BBYY.US](https://longbridge.com/zh-HK/quote/BBYY.US.md) - [UBS.US](https://longbridge.com/zh-HK/quote/UBS.US.md) - [01376.HK](https://longbridge.com/zh-HK/quote/01376.HK.md) - [MSFT.US](https://longbridge.com/zh-HK/quote/MSFT.US.md) - [BMWYY.US](https://longbridge.com/zh-HK/quote/BMWYY.US.md) - [BMW.DE](https://longbridge.com/zh-HK/quote/BMW.DE.md) - [CRM.US](https://longbridge.com/zh-HK/quote/CRM.US.md) - [NOW.US](https://longbridge.com/zh-HK/quote/NOW.US.md) - [WDAY.US](https://longbridge.com/zh-HK/quote/WDAY.US.md) - [UBER.US](https://longbridge.com/zh-HK/quote/UBER.US.md) - [PLTR.US](https://longbridge.com/zh-HK/quote/PLTR.US.md) - [89988.HK](https://longbridge.com/zh-HK/quote/89988.HK.md) - [HBBD.SG](https://longbridge.com/zh-HK/quote/HBBD.SG.md) - [BMW3.DE](https://longbridge.com/zh-HK/quote/BMW3.DE.md) ## 相關資訊與研究 - [【AI】阿里雲 QoderWork 推出「峯谷 Token」,錯峯使用 Qwen3.7-Max 低至 2 折](https://longbridge.com/zh-HK/news/290649598.md) - [阿里升級大模型組織架構,設 Token Foundry 事業](https://longbridge.com/zh-HK/news/289134394.md) - [【AI】百度智能雲發布百度千帆 Token Plan 企業版,提供 GLM-5.2 等模型](https://longbridge.com/zh-HK/news/290762351.md) - [陸媒:智譜開源模型用 1/6 的價格打爆美國 AI 護城河](https://longbridge.com/zh-HK/news/290839326.md) - [和電香港推一系列 AI 創新產品及服務 指定 5G 計劃送 800 億 Token](https://longbridge.com/zh-HK/news/290010002.md)