
从 “会聊天” 到 “干实事”,亚马逊云科技让 Agent“长出了手脚”


美国西部时间 12 月 2 日的 2025 亚马逊云科技 re:Invent 上,亚马逊云科技首席执行官 Matt Garman 在开场演讲中抛出了一个观点:AI Agent 时代已来,未来将出现数十亿 AI Agent,为企业提效 10 倍以上!
现场兴奋和焦灼情绪交织,数万名开发者和企业高管都在等一个答案。
因为在很多人的印象里,AI Agent 的现实体感并不乐观:开发门槛高、编排逻辑复杂、安全治理缺位、上下文记忆像金鱼……导致了一个尴尬的行业现状——90% 的 Agent 项目停留在概念验证阶段。
想要从概念验证走向生产可用,中间隔着的不仅仅是代码行数,而是一道道深不见底的 “工程鸿沟”。
悬念并未持续太久。
亚马逊云科技 Agentic AI 副总裁 Swami Sivasubramanian,在 12 月 3 日的主论坛上,用严谨且务实的演讲给出了答案——怎么把 AI Agent 从概念验证推向生产环境。
01 对症下药,解决 POC 到生产环境的五大顽疾
为什么不少企业的 Agent“看起来很美,用起来很废”?
剥开光鲜的 Demo 外衣,在生产环境中面临着五个棘手的痛点:
1、部署难、扩展难,一上生产就不稳定;
2、记忆缺失,Agent 无法跨任务学习,无法持续执行大型流程;
3、身份、权限、凭证管理太难,易出安全事故;
4、工具、数据、系统碎片化,集成成本极高;
5、无法观测、无法调试,Agent 成为黑箱。
Swami 在演讲中一针见血地指出:“大多数实验和 PoC 并未按生产就绪的标准来设计。我们需要弥合这一差距,打破 PoC 的桎梏。” 相对应的,亚马逊云科技对 Agent 在生产环境中遇到的顽疾,通过 Amazon Bedrock AgentCore 进行了对症下药。

AgentCore Runtime提供了一个无服务器、强隔离、长时运行的环境,彻底让开发者告别用拼凑的 Lambda 函数和脚本手搓的运行环境,实现了 Serverless 托管执行、强会话隔离、长时会话等能力,解决了 “状态管理” 的老大难问题,让 Agent 能够像人类员工一样长期在线,随时待命。
AgentCore Memory构建了短期 + 长期 + 情景记忆的三层体系,让 Agent 具备了 “记住→学习→改进→再执行” 的闭环能力。特别是 “情景记忆”,可以让 Agent 记住 “发生过什么事” 以及 “为什么那次流程很混乱”,并自动学习策略、优化下一次行动路径,实现企业 Agent 所需的 “连续性” 与 “可学习性”。
AgentCore Identity赋予了 Agent“可控、可审计、可授权” 的企业级身份体系,实现从 “人类身份体系” 向 “Agent 身份体系” 的扩展。毕竟在真实的生产环境中,最可怕的不是 Agent 不工作,而是拿着 CEO 的权限去读 HR 的数据库,需要精准控制 Agent 的权限,把潜在的安全隐患锁死在笼子里。
AgentCore Gateway扮演了 “协调枢纽” 的角色,自动扫描分散在数据库、SaaS 应用、旧系统里的数据,自动生成 Agent 的 “工具地图”,让 Agent 能安全、智能、自动地 “发现→连接→使用” 所有工具与数据。
AgentCore Observability解决的是 “黑盒” 问题,让企业能实时看到 Agent 的推理、工具调用、状态流、错误、上下文与决策路径等工作流程,提前验证 Agent 会不会搞砸,避免出了问题却找不到原因。
亚马逊云科技开出的 “药方” 是否奏效呢?
可以佐证的是汽车服务与技术提供商 Cox Automotive 的例子,使用 AgentCore 搭建了一个名为 Fleet Mate 的 Agent,原本需要 2 天时间的车辆评估被压缩到了 30 分钟。
02 瞄准靶心,让模型定制成为产品化工程
解决 Agent 的工程落地只是第一步,大模型同样是制约生产力的瓶颈,很多企业面临的障碍不亚于生产环境。
譬如通用大模型不懂企业业务,而且模型参数规模大、推理成本高、延迟难以满足业务要求;业务规则经常变、新场景不断出现,导致模型上线后效果会衰退;模型定制需要 MLOps、SRE、算法、数据团队协作,需要专业的团队才能做……能力强、速度快、成本低几乎成了不可能三角。
监督微调、模型蒸馏、强化学习是业内公认的 “三大法宝”,亚马逊云科技的解题思路也不例外。
不同的是,亚马逊云科技打出了一套组合拳,从 “微调” 到 “预训练”,把模型定制从玄学变成了工程学。

一是 Amazon Bedrock 强化微调。
传统的微调(SFT)只是教模型 “怎么说话”,而强化学习(RL)是教模型 “怎么做对”。但强化学习需要构建复杂的奖励模型,难度太大了。
亚马逊云科技的强化微调(RFT)功能,直接把强化学习的门槛踏平了,只需要提供数据,就能自动处理奖励建模和策略优化,能够将模型的准确性提升 66%,让一个小模型通过针对性的强化训练,在特定任务上吊打通用大模型。
二是 Amazon SageMaker AI 无服务器定制。
以前训练一个模型,需要配环境、调参、洗数据,准备工作就需要几个月,Amazon SageMaker AI 提出了新的思路——用 AI 来制造 AI。
企业用自然语言描述需求,SageMaker 内置的 Agent 会自动分析场景、推荐微调技术、甚至直接帮企业生成合成数据,然后自动跑完训练流程。把 “需要大团队、长周期、重投入” 的模型定制,变成了 “几天完成的自动化任务”。
三是 Amazon Nova Forge。
像医药、金融等行业,不仅需要微调大模型,还要模型在底层就理解行业逻辑,但在传统的流程里,企业数据无法进入预训练阶段。
Amazon Nova Forge 全球首创了 “开放训练模型” 体系,允许企业在模型的 “中途训练阶段” 介入,注入自己的专有数据,不再是打补丁式的微调,而是让企业以极低的成本,拥有了一个 “流淌着自己血液” 的预训练模型。
四是 Amazon SageMaker HyperPod 无检查点训练。
在大模型训练的过程中,断点续训一直是噩梦,一次 GPU 故障可能导致数小时的进度回滚,造成真金白银的损失。
Swami 在演讲中提到了 HyperPod 无检查点训练的 “黑科技”,通过实时保存模型状态,在硬件故障时,能在几分钟内自动恢复,不需要回滚到几个小时前的 Checkpoints,大大降低了大规模训练的沉没成本。
做一个总结的话,亚马逊云科技开启了一场从 “把模型训练好”,到 “把模型训练得起、用得好” 的全链路效率革命,让模型定制从技能工程,进化为可复制的产品化工程。
03 落地为王,打通可信、可靠、可协作闭环
企业把 Agent 推向生产环境后,CEO 们最担心的问题,可能不是 “它能不能做”,而是 “我敢不敢让它做”。
摆在案头的是更深层次的挑战:Agent 是否可信,在和客户沟通时会不会乱讲?Agent 是否可靠,业务成功率能否达到企业要求?Agent 能否与人类协同,融入已有客服/运营/业务流程?
喊出 “为企业提效 10 倍以上” 的亚马逊云科技,不只要帮企业打造生产环境、训练更聪明的大脑,还要打消 “敢不敢用” 的疑虑。亚马逊云科技没有回避,在主题演讲中留出了相当长的篇幅。
首先是可信。
亚马逊云科技杰出科学家 Byron Cook 讲了一个深刻的逻辑:大模型是基于统计学的,是概率性的,天生存在幻觉;而企业的规则(尤其是 GDPR 等合规要求的出海企业)是逻辑性的、是确定的。

怎么解决这个矛盾呢?答案是神经符号 AI。
简单来说就是把 “左脑的逻辑” 和 “右脑的直觉” 结合起来。亚马逊云科技引入了 “自动推理” 技术,带来了三大能力:
验证输出:自动推理工具验证 LLM 的答案是否满足逻辑和规则。
训练结合:使用定理证明器训练,使模型天然具备逻辑正确性。
约束解码:推理层嵌入验证器,使模型不能越界生成内容。
目前神经符号 AI 已经应用到 Amazon Kiro、AgentCore Policy 等产品中,让 Agent 既聪明又听话。
然后是可靠。
Agent 落地的最大障碍之一在于,“大脑” 和 “手脚” 是分离训练的,导致模型懂流程,但操作起来 “笨手笨脚”。

亚马逊云科技正式发布了 Amazon Nova Act,一个专门为 “行动” 而生的模型,在训练中进行了数百个环境 + 数千工作流程 + 数十万交互的强化学习,进行了成千上万次的试错。结果超出了不少人的预期:在企业自动化工作流中,Amazon Nova Act 实现了 90% 的成功率。
也就是说,企业可以放心地把点按钮、填表单、跑流程这些活儿交给 Agent,不必担心它卡在某个弹窗时不知所措。
最终是可协作。
Agent 的终局是什么?是替代人类吗?亚马逊云科技的回答是 “Teammate”(队友)。

折射到技术层面上,Amazon Connect 新增了 8 项 AI 能力,包括让 AI 像真人一样说话的神经声音集成 (Sonic)、基于对话自动建议下一步的实时推荐 Agent、结合点击流数据个性化建议的 AI 驱动预测洞察等。
正如 2025 亚马逊云科技 re:Invent 上所演示的:在一个信用卡盗刷的场景中,Agent 不仅自动验证了身份,还通过分析地理位置和交易模式,预判了欺诈风险,并在后台默默地为人类客服准备好了所有资料。人类客服接起电话的那一刻,问题已经解决了一半。
Agent 不再只是工具,而是和人类一起协作的队友。
04 写在最后
2025 年的亚马逊云科技 re:Invent,更像是一个时代的分水岭。
过去两年里,行业对 Agent 的热情大多停在愿景层;现在,亚马逊云科技给出了一套从基础设施到模型、从安全到协作、从执行到治理的落地体系。
第一层:AgentCore(让 Agent 能跑起来),解决了部署、管理、记忆、安全、工具接入、可观测性等基础工程问题。
第二层:模型定制(让 Agent 跑得好),通过 RFT、无服务器定制、HyperPod 等把模型从 “通用” 变成 “企业专属”。
第三层:可信 + 可靠 + 协作(让企业敢用),让 Agent 变得可控、可靠、可协作,成为一个可托付的数字员工。
如果说 2023 年是生成式 AI 的元年,2024 年是 Agent 的试验期,2025 年则正式宣告:AI Agent 进入企业级生产阶段的时代,已经到来。
本文版权归属原作者/机构所有。
当前内容仅代表作者观点,与本平台立场无关。内容仅供投资者参考,亦不构成任何投资建议。如对本平台提供的内容服务有任何疑问或建议,请联系我们。

