Alter聊科技
2025.12.04 10:50

從 “會聊天” 到 “幹實事”,亞馬遜雲科技讓 Agent“長出了手腳”

portai
我是 PortAI,我可以總結文章信息。

美國西部時間 12 月 2 日的 2025 亞馬遜雲科技 re:Invent 上,亞馬遜雲科技首席執行官 Matt Garman 在開場演講中拋出了一個觀點:AI Agent 時代已來,未來將出現數十億 AI Agent,為企業提效 10 倍以上!

現場興奮和焦灼情緒交織,數萬名開發者和企業高管都在等一個答案。

因為在很多人的印象裏,AI Agent 的現實體感並不樂觀:開發門檻高、編排邏輯複雜、安全治理缺位、上下文記憶像金魚……導致了一個尷尬的行業現狀——90% 的 Agent 項目停留在概念驗證階段。

想要從概念驗證走向生產可用,中間隔着的不僅僅是代碼行數,而是一道道深不見底的 “工程鴻溝”。

懸念並未持續太久。

亞馬遜雲科技 Agentic AI 副總裁 Swami Sivasubramanian,在 12 月 3 日的主論壇上,用嚴謹且務實的演講給出了答案——怎麼把 AI Agent 從概念驗證推向生產環境。

01 對症下藥,解決 POC 到生產環境的五大頑疾

為什麼不少企業的 Agent“看起來很美,用起來很廢”?

剝開光鮮的 Demo 外衣,在生產環境中面臨着五個棘手的痛點:

1、部署難、擴展難,一上生產就不穩定;

2、記憶缺失,Agent 無法跨任務學習,無法持續執行大型流程;

3、身份、權限、憑證管理太難,易出安全事故;

4、工具、數據、系統碎片化,集成成本極高;

5、無法觀測、無法調試,Agent 成為黑箱。

Swami 在演講中一針見血地指出:“大多數實驗和 PoC 並未按生產就緒的標準來設計。我們需要彌合這一差距,打破 PoC 的桎梏。” 相對應的,亞馬遜雲科技對 Agent 在生產環境中遇到的頑疾,通過 Amazon Bedrock AgentCore 進行了對症下藥。

AgentCore Runtime提供了一個無服務器、強隔離、長時運行的環境,徹底讓開發者告別用拼湊的 Lambda 函數和腳本手搓的運行環境,實現了 Serverless 託管執行、強會話隔離、長時會話等能力,解決了 “狀態管理” 的老大難問題,讓 Agent 能夠像人類員工一樣長期在線,隨時待命。

AgentCore Memory構建了短期 + 長期 + 情景記憶的三層體系,讓 Agent 具備了 “記住→學習→改進→再執行” 的閉環能力。特別是 “情景記憶”,可以讓 Agent 記住 “發生過什麼事” 以及 “為什麼那次流程很混亂”,並自動學習策略、優化下一次行動路徑,實現企業 Agent 所需的 “連續性” 與 “可學習性”。

AgentCore Identity賦予了 Agent“可控、可審計、可授權” 的企業級身份體系,實現從 “人類身份體系” 向 “Agent 身份體系” 的擴展。畢竟在真實的生產環境中,最可怕的不是 Agent 不工作,而是拿着 CEO 的權限去讀 HR 的數據庫,需要精準控制 Agent 的權限,把潛在的安全隱患鎖死在籠子裏。

AgentCore Gateway扮演了 “協調樞紐” 的角色,自動掃描分散在數據庫、SaaS 應用、舊系統裏的數據,自動生成 Agent 的 “工具地圖”,讓 Agent 能安全、智能、自動地 “發現→連接→使用” 所有工具與數據。

AgentCore Observability解決的是 “黑盒” 問題,讓企業能實時看到 Agent 的推理、工具調用、狀態流、錯誤、上下文與決策路徑等工作流程,提前驗證 Agent 會不會搞砸,避免出了問題卻找不到原因。

亞馬遜雲科技開出的 “藥方” 是否奏效呢?

可以佐證的是汽車服務與技術提供商 Cox Automotive 的例子,使用 AgentCore 搭建了一個名為 Fleet Mate 的 Agent,原本需要 2 天時間的車輛評估被壓縮到了 30 分鐘。

02 瞄準靶心,讓模型定製成為產品化工程

解決 Agent 的工程落地只是第一步,大模型同樣是制約生產力的瓶頸,很多企業面臨的障礙不亞於生產環境。

譬如通用大模型不懂企業業務,而且模型參數規模大、推理成本高、延遲難以滿足業務要求;業務規則經常變、新場景不斷出現,導致模型上線後效果會衰退;模型定製需要 MLOps、SRE、算法、數據團隊協作,需要專業的團隊才能做……能力強、速度快、成本低幾乎成了不可能三角。

監督微調、模型蒸餾、強化學習是業內公認的 “三大法寶”,亞馬遜雲科技的解題思路也不例外。

不同的是,亞馬遜雲科技打出了一套組合拳,從 “微調” 到 “預訓練”,把模型定製從玄學變成了工程學。

一是 Amazon Bedrock 強化微調。

傳統的微調(SFT)只是教模型 “怎麼説話”,而強化學習(RL)是教模型 “怎麼做對”。但強化學習需要構建複雜的獎勵模型,難度太大了。

亞馬遜雲科技的強化微調(RFT)功能,直接把強化學習的門檻踏平了,只需要提供數據,就能自動處理獎勵建模和策略優化,能夠將模型的準確性提升 66%,讓一個小模型通過針對性的強化訓練,在特定任務上吊打通用大模型。

二是 Amazon SageMaker AI 無服務器定製。

以前訓練一個模型,需要配環境、調參、洗數據,準備工作就需要幾個月,Amazon SageMaker AI 提出了新的思路——用 AI 來製造 AI。

企業用自然語言描述需求,SageMaker 內置的 Agent 會自動分析場景、推薦微調技術、甚至直接幫企業生成合成數據,然後自動跑完訓練流程。把 “需要大團隊、長週期、重投入” 的模型定製,變成了 “幾天完成的自動化任務”。

三是 Amazon Nova Forge。

像醫藥、金融等行業,不僅需要微調大模型,還要模型在底層就理解行業邏輯,但在傳統的流程裏,企業數據無法進入預訓練階段。

Amazon Nova Forge 全球首創了 “開放訓練模型” 體系,允許企業在模型的 “中途訓練階段” 介入,注入自己的專有數據,不再是打補丁式的微調,而是讓企業以極低的成本,擁有了一個 “流淌着自己血液” 的預訓練模型。

四是 Amazon SageMaker HyperPod 無檢查點訓練。

在大模型訓練的過程中,斷點續訓一直是噩夢,一次 GPU 故障可能導致數小時的進度回滾,造成真金白銀的損失。

Swami 在演講中提到了 HyperPod 無檢查點訓練的 “黑科技”,通過實時保存模型狀態,在硬件故障時,能在幾分鐘內自動恢復,不需要回滾到幾個小時前的 Checkpoints,大大降低了大規模訓練的沉沒成本。

做一個總結的話,亞馬遜雲科技開啓了一場從 “把模型訓練好”,到 “把模型訓練得起、用得好” 的全鏈路效率革命,讓模型定製從技能工程,進化為可複製的產品化工程。

03 落地為王,打通可信、可靠、可協作閉環

企業把 Agent 推向生產環境後,CEO 們最擔心的問題,可能不是 “它能不能做”,而是 “我敢不敢讓它做”。

擺在案頭的是更深層次的挑戰:Agent 是否可信,在和客户溝通時會不會亂講?Agent 是否可靠,業務成功率能否達到企業要求?Agent 能否與人類協同,融入已有客服/運營/業務流程?

喊出 “為企業提效 10 倍以上” 的亞馬遜雲科技,不只要幫企業打造生產環境、訓練更聰明的大腦,還要打消 “敢不敢用” 的疑慮。亞馬遜雲科技沒有迴避,在主題演講中留出了相當長的篇幅。

首先是可信。

亞馬遜雲科技傑出科學家 Byron Cook 講了一個深刻的邏輯:大模型是基於統計學的,是概率性的,天生存在幻覺;而企業的規則(尤其是 GDPR 等合規要求的出海企業)是邏輯性的、是確定的。

怎麼解決這個矛盾呢?答案是神經符號 AI。

簡單來説就是把 “左腦的邏輯” 和 “右腦的直覺” 結合起來。亞馬遜雲科技引入了 “自動推理” 技術,帶來了三大能力:

驗證輸出:自動推理工具驗證 LLM 的答案是否滿足邏輯和規則。

訓練結合:使用定理證明器訓練,使模型天然具備邏輯正確性。

約束解碼:推理層嵌入驗證器,使模型不能越界生成內容。

目前神經符號 AI 已經應用到 Amazon Kiro、AgentCore Policy 等產品中,讓 Agent 既聰明又聽話。

然後是可靠。

Agent 落地的最大障礙之一在於,“大腦” 和 “手腳” 是分離訓練的,導致模型懂流程,但操作起來 “笨手笨腳”。

亞馬遜雲科技正式發佈了 Amazon Nova Act,一個專門為 “行動” 而生的模型,在訓練中進行了數百個環境 + 數千工作流程 + 數十萬交互的強化學習,進行了成千上萬次的試錯。結果超出了不少人的預期:在企業自動化工作流中,Amazon Nova Act 實現了 90% 的成功率。

也就是説,企業可以放心地把點按鈕、填表單、跑流程這些活兒交給 Agent,不必擔心它卡在某個彈窗時不知所措。

最終是可協作。

Agent 的終局是什麼?是替代人類嗎?亞馬遜雲科技的回答是 “Teammate”(隊友)。

折射到技術層面上,Amazon Connect 新增了 8 項 AI 能力,包括讓 AI 像真人一樣説話的神經聲音集成 (Sonic)、基於對話自動建議下一步的實時推薦 Agent、結合點擊流數據個性化建議的 AI 驅動預測洞察等。

正如 2025 亞馬遜雲科技 re:Invent 上所演示的:在一個信用卡盜刷的場景中,Agent 不僅自動驗證了身份,還通過分析地理位置和交易模式,預判了欺詐風險,並在後台默默地為人類客服準備好了所有資料。人類客服接起電話的那一刻,問題已經解決了一半。

Agent 不再只是工具,而是和人類一起協作的隊友。

04 寫在最後

2025 年的亞馬遜雲科技 re:Invent,更像是一個時代的分水嶺。

過去兩年裏,行業對 Agent 的熱情大多停在願景層;現在,亞馬遜雲科技給出了一套從基礎設施到模型、從安全到協作、從執行到治理的落地體系。

第一層:AgentCore(讓 Agent 能跑起來),解決了部署、管理、記憶、安全、工具接入、可觀測性等基礎工程問題。

第二層:模型定製(讓 Agent 跑得好),通過 RFT、無服務器定製、HyperPod 等把模型從 “通用” 變成 “企業專屬”。

第三層:可信 + 可靠 + 協作(讓企業敢用),讓 Agent 變得可控、可靠、可協作,成為一個可託付的數字員工。

如果説 2023 年是生成式 AI 的元年,2024 年是 Agent 的試驗期,2025 年則正式宣告:AI Agent 進入企業級生產階段的時代,已經到來。

本文版權歸屬原作者/機構所有。

當前內容僅代表作者觀點,與本平台立場無關。內容僅供投資者參考,亦不構成任何投資建議。如對本平台提供的內容服務有任何疑問或建議,請聯絡我們。