
AI 狂熱不敵冷峻現實:企業下調 AI 代理預期,實現全自動化仍需數年時間

媒體報道,企業正從 AI 代理的狂熱預期中回落:儘管 AI 聊天與編碼工具已提升效率,但能 “接管整份工作” 的 AI 代理在落地中頻頻受挫,不僅部署難、成本高,還常出現自信卻錯誤的輸出,難以用於客服和網絡安全等關鍵環節。多家企業放緩全自動化計劃,轉向 “人機協作” 模式,並將 AI 代理視為需長期投入、短期難見成效的研發項目。一些科技高管預計,AI 代理距離真正成熟落地仍需數年時間。
媒體報道,AI 通過通用型聊天機器人和 AI 編程工具正在改變人們的工作方式,為 OpenAI 和微軟等公司的收入帶來增長,各家公司一直在嘗試把員工的工作內容交給人工智能代理(AI agents)。
然而,許多企業在使用更復雜的 AI 代理時卻遇到了困難,這些代理往往 “勝任不了工作”,因此 AI 提供商不得不親自介入、與客户一起排查問題,避免 AI“搞砸事情”。
例如,歐洲零售商 Fnac 在使用 AI 客服代理時遇到困難。Fnac 曾測試過 OpenAI、Google 和其他實驗室的模型,但效果不佳。該公司首席數字與電商負責人 Olivier Theulle 對媒體表示,可靠性是個問題:當顧客反饋產品有缺陷時,AI 要求顧客提供產品序列號,但卻把這些序列號與其他產品的序列號混淆了,而這些序列號僅有一位數字不同。
Fnac 每年營收達 100 億美元。Theulle 説,直到與以色列公司 AI21 Labs 達成合作,並獲得其工程師的協助後,這個 AI 代理的表現才開始變得穩定。AI21 聯合 CEO Ori Goshen 説,
“問題在於,模型開箱即用時在各類基準測試上表現很好,但在真實企業環境中表現並不好。”
“需要進行相當程度的定製化。”
一些公司對媒體表示,只有在自家軟件工程師花上數月時間部署 AI 代理,並從 AI 公司那裏獲得直接技術支持後,他們才能真正從中受益。如今,科技公司領導者也表示,企業不能指望在沒有 AI 廠商 “手把手扶持” 的情況下,讓複雜 AI 項目順利運行。
風投 Vinod Khosla 在 10 月接受媒體採訪時表示,
“這就像説 ‘我們有輛賽車,任何人都能開’,但普通人根本無法發揮賽車的最大性能。”
Khosla 是 OpenAI 的早期投資者,最近又投資了一家 AI 諮詢初創公司,該公司向 T-Mobile 等企業派駐工程師,幫助他們在大型組織內落地 AI。這家初創公司 Distyl 只是眾多在該領域崛起的公司之一,它們為需要支持的企業提供高科技諮詢服務。OpenAI、Anthropic、Salesforce 和 Snowflake 等 AI 開發商和 AI 代理提供商也開始招聘前線部署工程師(FDEs)或推出類似諮詢服務,但這往往會提高他們的成本。
另一個例子則是專為汽車經銷商提供軟件、年銷售額 90 億美元的 Cox Automotive。此前該公司開發一個 AI 代理,用於為經銷商製作營銷網頁。由於該公司是亞馬遜雲服務 AWS 在汽車領域的最大客户之一,所以得到了 “白手套式的服務”。
Cox 首席產品官 Marianne Johnson 對媒體表示,AWS 工程師和為該代理提供 AI 技術的 Anthropic 工程師飛到 Cox 位於亞特蘭大的總部,與 Cox 的軟件開發人員並肩工作了數天共同構建這個工具。她拒絕透露 Cox 為此向 AWS 和 Anthropic 支付了多少費用,但估計未來數年可節省數百萬美元的人力成本,因為公司無需再人工為客户製作網站。
“它很自信地胡説八道”
AI 代理的目標是處理客户服務問題、管理 IT 系統等各種任務。AI 和雲服務提供商正在押注企業使用 AI 代理帶來的收入,將其作為未來一兩年投入數千億美元建設 AI 數據中心的理由。
但這些供應商以及部分客户高管表示,AI 代理太難配置,而且行為常常不可預測。這使得它們無法用於那些一旦出錯就會造成嚴重後果的任務。因此客户降低了預期,不再奢望 AI 代理能自動化太多工作,並暫緩在客户支持和網絡安全等關鍵崗位部署 AI 代理。
例如,IT 服務巨頭 Kyndryl 今年開始測試微軟的 Security Copilot,這是一款聊天機器人,旨在對接企業 IT 系統,用簡單英語解釋潛在安全漏洞,相當於自動化網絡安全分析師的工作。但負責公司內部網絡安全的 Scott Owenby 對媒體表示,當 Kyndryl 員工嘗試詢問一些基礎問題,比如 “哪些公司設備運行的是過期軟件” 時,Security Copilot 給出的答案明顯是錯誤的。Owenby 説,
“它信心滿滿地胡説八道,而我佩服這種自信,但我無法相信它的數據。”
Kyndryl 花了約 5 萬美元測試了 Security Copilot 六個月,之後決定停止使用這款軟件。Owenby 説,
“我基本上是把 5 萬美元燒了。這不算多,如果哪怕有一點用我們都會繼續用,但我們沒想到它居然完全沒法用。”
Owenby 還説,其他 AI 工具效果更好,例如 Palo Alto Networks 的軟件可以自動處理網絡安全中重複繁瑣的工作,例如調查員工從新地點登錄或截取敏感數據截圖的情況。這使得他過去一年減少了部分安全團隊的人手,但他表示仍然需要工作人員監控這些 AI 工具,而不能完全讓 AI 全權執行。
“有些炒作成分”
博世電動工具(Bosch Power Tools)年營收超 57 億美元。該公司數字客户體驗負責人 Florian Haustein 對媒體表示,公司一年多以來一直在測試一款聊天機器人,用於回答客户關於工具使用方式和故障排查的問題。
但 Haustein 表示,這款聊天機器人仍然經常給出錯誤答案,一些錯誤答案甚至可能導致用户受傷。因此,該項目仍停留在試點階段。他還表示,博世正在測試 Google、OpenAI 等多家實驗室的模型。
Haustein 對媒體説,博世在另一個不那麼激進的客服聊天機器人上收效更好,該機器人只回答更基礎的問題,例如在哪可以買到某款產品;還有一款由 SAP 提供的 AI 工具能讀取客户諮詢內容,並自動分配給合適的人類員工。Haustein 説,
“我認為 ‘完全用 AI 做客服’ 有些炒作。”
“你必須確保答案接近 100% 準確……但我們仍然看到幻覺和錯誤答案。我認為我們還沒有達到能夠完全自動化所需要的信心水平。”
一些技術供應商也承認 AI 代理還未成熟。亞馬遜 CEO Andy Jassy 在上週四的財報電話會上説:
“現階段,構建 AI 代理仍比想象中困難。”
“但隨着時間推移,企業從 AI 中實現的很多價值將來自 AI 代理。”
AI 代理產品收入難計算
目前,通用聊天機器人、編程助手、AI 搜索和 AI 視頻生成工具的採用,已經幫助工程、市場和產品管理團隊提升了效率,企業高管們對媒體表示。
這推動了 AI 供應商的新收入增長:根據媒體的生成式 AI 數據庫,由 OpenAI 和 Anthropic 引領的 20 家 AI 原生初創公司,每年因 AI 辦公用途獲得的年化收入已達 230 億美元,而三年前幾乎為零。
但要單獨計算 “AI 代理” 帶來的收入卻很困難。在 Google、微軟和亞馬遜等雲公司,大部分收入增長來自 OpenAI、Anthropic 和 Meta 等大型 AI 開發商租用服務器,而非企業類 AI 應用。
在出售 AI 代理的企業軟件公司中,結果不一。Salesforce 今年早些時候表示,其 Agentforce 產品(用於自動化銷售郵件、跟蹤發票等任務)年收入超過 1 億美元。ServiceNow 則稱,其用於自動處理 IT 服務工單的 AI 軟件,有望在 2026 年底前實現 10 億美元收入。但這兩家公司的收入增長最近幾個季度都比 2023 年大多數時間慢。
SAP 尚未單獨公佈 AI 產品收入,但 CEO Christian Klein 在本月的財報電話中表示,AI 將在未來兩年帶來 “雙位數收入增長”。
許多提供 AI 代理的軟件公司,包括 Salesforce、Snowflake 和 Xero,目前甚至沒有對這類產品收費,他們希望等客户真正認可價值之後再收費。
ServiceNow 全球客户運營總裁 Paul Fipps 對媒體表示,近期客户在試點 AI 功能方面不再那麼興奮,因為他們變得更加現實,開始考慮 AI 代理究竟能合理自動化哪些任務。Fipps 説,
“在過去 12 到 18 個月裏,由於生成式 AI 的發展速度太快,很多客户積極試點這些 AI 能力,鐘擺被推到了極端的一側。”
“現在你看到鐘擺開始回擺。”
他仍然樂觀,認為隨着 AI 代理不斷進步,未來幾年企業會繼續大力投入。
目前,AI 代理在軟件開發領域最成功。AI 編程代理正成為許多公司工程團隊的標配。但軟件工程師仍需檢查 AI 的代碼,因為 AI 會犯錯,意味着任務還不能完全自動化。
“保持現實”
Palo Alto Networks 首席執行官 Nikesh Arora 表示,銷售 AI 工具的公司必須謹慎,不要過度承諾 AI 能自動化多少工作。他認為,網絡安全崗位要實現完全自動化仍需數年。
“我們保持現實的態度,(完全自動化)需要更多努力,我們必須非常確定,當把操作交給 AI 時,它採取的行動是正確的,因為網絡安全是有後果的。”
儘管如此,公司仍然認可 AI 代理帶來的收益,即使需要 “有人看着”。例如,加拿大太陽馬戲團 Cirque du Soleil 正在使用 SAP 提供的一款 AI 代理,追蹤其服裝和舞台佈景供應商的發票。
當供應商發郵件詢問發票狀態時,AI 代理會檢查 SAP 系統中發票是否處理完畢,並草擬回覆郵件。過去,該公司有兩名全職員工做這件事;現在,這兩人已被安排到其他部門,只需一人審核 AI 草稿再發出即可。
該工具的運營成本低於一名全職員工的薪資,副總裁 Philippe Lalumière 對媒體説:
“有時候 AI 寫的郵件不太禮貌,但供應商得到回覆更快、更清楚,所以整體滿意度更高。我們沒有因為它裁員,但生產力提升很明顯。”
與此同時,其他 AI 代理供應商也提醒客户,要把這些工具視為實驗性項目,而不是能立即帶來回報的投資。
微軟核心 AI 產品開發總裁 Asha Sharma 上週在 The Information 的 WTF 峯會上表示:
“把 AI 代理視為研發預算……一種將在未來 5 到 10 年見效的投資。”
“我認為我們還處在非常早期階段……我們現在有數百萬個 AI 代理投入生產使用,但大家仍然在摸索如何讓 AI 代理真正有用。”

