
智谱 AutoGLM 上线:给每个手机都装上通用 Agent

智谱发布了 AutoGLM 2.0,全球首个手机 Agent,具备推理、代码与多模态能力,能够在任何设备上执行多样化任务。用户可通过简单指令让 AutoGLM 操作美团、京东等应用,完成外卖、机票预订等任务。它不仅是聊天工具,更是全能代理人,能在办公场景中跨网站执行工作,生成内容并发布到社交媒体。
还记得「AI 给人类发的第一个红包」吗?
去年 10 月智谱发布全球首个 Phone-Use 产品 AutoGLM,开启 Agent 的新时代。
今天,AutoGLM 2.0 再次升级,将 Agent 应用提升到新的高度——
- 全球首个手机 Agent,人人可用;
- 开创 Agent+ 云手机/云电脑的新技术范式,不抢占用户手机和电脑;
- 突破硬件限制,在任何设备、任何场景下运行,帮助用户代理操作;
- 国产模型(GLM-4.5、GLM-4.5V)驱动,具备推理、代码与多模态的全能能力。
即刻起,人人都可使用 AutoGLM。我们将快速迭代推出新功能(“定时任务” 很快上线,AI 每天主动替你干活)。应用商店搜索 “AutoGLM”,或点击文末 “阅读原文”。
操作执行助手
过去的 AI 多停留在 “对话” 层面;一般的智能体助手也多局限于信息查询和总结。
AutoGLM 2.0 则实现了质的飞跃——它不再只是 “说”,而是真正能够 “做”。
事实上,在 AutoGLM 1.0 中,我们已探索过让 AI 代替用户完成部分手机操作,但只在有限场景下生效。随着 AutoGLM 2.0 的发布,它已经成长为一名执行型助手,能够在「云端」自主完成多样化的任务。
在生活场景中,用户只需一句话,就能让 AutoGLM 操作美团、京东、小红书、抖音等几十个高频应用:点外卖、订机票、查房源,例如帮你买「秋天的第一杯奶茶」。
在办公场景中,它同样能跨网站执行全流程工作,操作网页版的飞书、网易邮箱、知乎、微博、抖音、微头条等网站:从信息检索到内容撰写,再到生成视频、PPT 或播客,并直接完成小红书、抖音等社交媒体平台内容发布。
这意味着,AI 不再是一个 “聊天工具”,而是一个能真正替你干活的全能代理人。不仅能给出答案,还能把任务完整执行,帮助用户节省时间与精力,彻底改变人与 AI 的协作方式。
为 AI 配一台手机
AutoGLM 的主要亮点,是一个 APP 让一部手机成为真正的 “新物种”。
在 AutoGLM 2.0 中,我们为 AI 配备了专属智能体手机/智能体电脑,让它可以在云端自主干活、完成任务,而无需占用用户的本地设备,期间用户可以使用其他 APP(如刷抖音、打游戏)。
这意味着AI不仅能 “自动驾驶手机”,还可 “异步代理办公”。让手机变成具备自主执行、跨端协作能力的智能体手机。
AutoGLM 会以这样的产品形态出现,源于我们对AGI 早期形态的理解。我们认为从 Agent 到 AGI,还需要满足 3A 原则:
- Around-the-clock(全时):24 小时运行,即使用户离线,Agent 依然在执行任务;
- Autonomy without interference(自主零干扰):独立运行,不占用用户屏幕与算力,平行世界的搭子;
- Affinity(全域连接):跳出浏览器对话框,跨越手机、电脑、手表、眼镜、家电等设备,操作物理世界。
AI 新硬件
借助 AutoGLM 强大的云端执行能力,人与设备的交互方式正在被重新定义。
我们已将 AutoGLM 的操作执行能力封装为 API,开发者只需简单接入,即可将这一能力无缝融入各类硬件设备,从 AI 眼镜等可穿戴设备到传统家电。
AutoGLM首次让硬件具备完整的手机级操作能力,无需在端侧堆叠复杂系统或大容量电池。例如,可以通过智能眼镜点一杯咖啡。
今日起,AutoGLM 移动端 API 申请通道及开发者生态共建计划正式上线。除手机与电脑外,手表、眼镜、家电等设备都能成为 Agent 驱动的智能助手。
期待与更多开发者共同探索 AI 融入物理世界的无限可能。
技术 SOTA
AutoGLM 可以在国内免费向所有人开放,因为它是纯国产 Agent,成本相较于接入国外模型的 Agent 有了数量级的下降。
AutoGLM 由智谱最新开源 SOTA 语言模型 GLM-4.5 与视觉推理模型 GLM-4.5V 驱动。AutoGLM 将基座模型原生能力发挥到极致,并结合在「端到端异步强化学习」方面的多项突破成果,可以完成推理、编码、研究、Agentic 与 GUI 操作等多类任务,并可根据需求灵活调用最合适的「大脑」完成执行。
- ComputerRL:提出 API-GUI 协同范式,提升数据多样性与计算效率;改进 GRPO 并提出 Entropulse 机制,增强探索与策略多样性。
- MobileRL:创新难度自适应强化学习方法(推理自举预热 + 难度自适应 GRPO),显著提升移动端任务的稳定性与收敛效率。
- AgentRL:通过交叉采样与任务优势归一化机制,解决多任务训练中的不稳定与梯度分布不均,增强整体鲁棒性与效率。
在 Device Use 基准测试(涵盖手机、电脑和网页操作)中,AutoGLM 表现优于 ChatGPT Agent、UI-TARS-1.5 和 Claude Sonnet 4,展现出更强的鲁棒性与通用性,处于主流 Agent 的SOTA 水平。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

