作者 | 刘宝丹编辑 | 黄昱DeepSeek 已经成为行业风向标,在这场 AI 竞赛中,主流模型公司都在试图超越 DeepSeek,国内 AI 独角兽智谱也给出了自己的答卷。3 月 31 日,智谱在中关村论坛上正式发布 AutoGLM 沉思,这一全新智能体不仅具备深度研究能力(Deep Research),还能实现实际操作(Operator),真正推动 AI Agent 进入 “边想边干” 的阶段。作为全球首个集深度研究与实际操作能力于一体的 Agent,AutoGLM 沉思的发布是智谱自主智能体技术的一次重要进步,也是设备操控智能体的进一步升级。AutoGLM 沉思背后,智谱推出 Agentic GLM 系列矩阵,包括 GLM-4 基座模型、GLM-Z1 推理模型、GLM-Z1-Rumination 沉思模型和 AutoGLM 模型等,尤其是推理模型 GLM-Z1-Air,它拥有比肩 DeepSeek R1 的推理性能,而价格仅需 R1 的 1/30。距离 ChatGPT 出圈已经过去两年多,AI 大模型也从技术迭代转向应用落地,后者已经成为检验模型厂商竞争力的核心指标。目前,智谱已和三星等头部企业合作,还成为北京、上海等城市的合作伙伴。此外,智谱也启动了出海战略。智谱 CEO 张鹏对华尔街见闻表示,公司 2024 年商业化收入增长超过 100%,2025 年会有更大的增长机会。在这场 AI 大模型竞赛中,智谱开始探索出自己的成长路径。AutoGLM 沉思:边想边干4 个月前,智谱用 AutoGLM 实现了群发红包功能,这是 AI 发出的第一个红包,代表着 AI 大模型开始从对话走向操作。4 个月后,智谱将推理能力布局到 Agent 上。不同于上一次发红包,这次智谱开始用 Agent 赚到钱了。14 天前,智谱秘密开展了一项测试,公司注册了一个小红书号,专注于生活科普。然后用 AutoGLM 沉思生成笔记,比如怎么选咖啡壶、怎么做化妆品成分对比等。在现场演示中,张鹏表示,调查 2025 年化妆品最火的三大抗老成分,比对它们的作用、用法、优劣势,最后还要做严谨的比对分析。“有些任务可真不简单。”智谱现场揭晓了该账号的成绩:两周时间收获了 5000 粉丝,接到多条商单邀请,昨天,智谱发出了第一个商单,赚了 500 块钱。AutoGLM 沉思是首个集深度研究能力和网页操作能力于一体的 Agent,体现了智谱对 AI Agent 的最新理解,即让机器不仅能够思考,还能主动行动,实现 “边想边干” 的目标。这也是 AutoGLM 沉思与 Open AI 的 DeepResearch 不同的地方,沉思推动 AI Agent 从单纯的思考者,进化为能交付结果的智能执行者。张鹏表示,沉思突破了实时联网搜索、动态工具调用、深度分析和自我验证,实现真正的长程推理和任务执行。比如,让沉思写一篇报告,“关于哪吒 2 票房的成功将会给中国电影行业带来怎样的改变。” 据张鹏介绍,沉思模型很擅长做这类开放性的问题,需要模型自己去探索,最后它生成了近万字的报告。这次,智谱发布的是 AutoGLM 沉思 preview 版本,核心支持 research 场景。张鹏透露,在未来两周,将进一步扩展更多 Agent 的执行能力。此外,AutoGLM 沉思发布即上线,目前已经在智谱清言 PC 客户端上线。背后模型全栈自研AutoGLM 沉思模型的背后,是智谱自主研发的全栈大模型技术。整体来看,沉思融合了 GLM-4 的通用能力、GLM-Z1 的反思能力、GLM-Z1-Rumination 的沉思能力,以及 AutoGLM 的自动执行能力。智谱重新训练了一个 320 亿参数的基座模型 GLM-4-Air-0414,在预训练阶段加入了更多的代码类、推理类数据,并在对齐阶段针对智能体能力进行了优化,模型在工具调用、联网搜索、代码等智能体任务上的能力得到大大加强。会上,张鹏表示,GLM-4-Air-0414 以 32B 参数量比肩更大参数量的国内外主流模型,这使得模型在适配智能体任务方面特别有效。“这是因为智能体任务往往涉及多轮复杂交互,32B 的参数量使得 GLM-4-Air-0414 能快速执行复杂任务,为 AI 智能体的真正大规模落地应用提供了坚实基础。”基于 GLM-4-Air-0414,智谱推出了全新的深度思考模型 GLM-Z1-Air,在性能表现上,可以与 DeepSeek-R1(671B,激活 37B)媲美。在推理速度上,GLM-Z1-Air 相比 R1 提升了 8 倍,成本可以降低至 1/30,实现高性能与高性价比的双重突破。此外,GLM-Z1-Air 可在消费级显卡上运行。基于 GLM-Z1,智谱通过扩展强化学习训练,提升了模型结合工具使用完成长程推理能力,训练出沉思模型 GLM-Z1-Rumination。张鹏表示,该模型突破了传统 AI 单纯依赖内部知识推理的局限,创新性地结合实时联网搜索、动态工具调用、深度分析和自我验证,形成完整的自主研究流程。GLM-Z1-Rumination 能够主动理解用户需求,在复杂任务中不断优化推理、反复验证与修正假设,使研究成果更具可靠性与实用性。相比于传统的推理模型,智谱期待沉思模型引领 AI 助手进入一个 “高智商” 到 “高智商 + 高自主” 的阶段。Agent 的核心就是推理规划和动手能力。如果说沉思模型是 AutoGLM 沉思的大脑,那么,AutoGLM 则是 AutoGLM 沉思的手脚。智谱去年 10 月发布了 AutoGLM,它是全球首个能够在手机上执行长达 50 多步 action 的大模型智能体,AutoGLM 沉思版背后的 AutoGLM 能力,较上次发布也有了非常大的进化。张鹏表示,大模型的预训练和后训练存在 Scaling Law,Agent 也存在类似的 Scaling Law。“在 Agent Scaling Law 的基础上,我们进一步发现了 Agent 存在的能力涌现。”比如,在训练中,从未教给 AutoGLM 沉思访问过巨潮资讯网。然而,当发送指令 “帮我收集昨天关于具身智能的相关研报” 时,AutoGLM 沉思能够规划出通过访问巨潮资讯解决问题的方案,并顺利操作了网站。张鹏表示,AutoGLM 的动手能力目前在行业内处于 Sota,包括浏览器、手机和电脑在内的使用工具能力,全面领先。在 GUI 智能体方面,CogAgent 在 GUI Agent 的多个榜单上取得了 Sota 的结果。上述一系列成绩背后,离不开智谱对 Agent 的前瞻性布局。从 2023 年 10 月最早推出具备 FunctionCall 能力的智谱清言,到 2024 年 1 月上线支持智能体编排的 GLMs,再到 2024 年 10 月推出 AutoGLM,以及今天推出的 AutoGLM 沉思,智谱一直在引领对 Agent 的探索。在经过 6 年的技术沉淀后,智谱终于开始在这场 AI 竞赛中展现出更多竞争力。开源并不等于免费与 DeepSeek 和阿里等 AI 公司一样,智谱也坚持开源策略。张鹏表示,上述模型将于 4 月 14 日开源,并将在未来两周内陆续上线 MaaS 平台。阿里开源的商业逻辑是为了售卖云计算服务,对模型厂商而言,开源就意味着把核心技术公开,对于商业化会带来一定挑战。张鹏也坦诚,开源对商业化市场会有一些影响。不过,他也强调,开源并不等于完全免费,后期技术人员的投入、维护成本,包括如何把 DeepSeek 做本地化落地等,成本一点都不低,要找专业团队来解决问题。目前,市面上有各种智能体产品,作为很早就开始智能体相关研究的模型厂商,智谱深谙市场需求。张鹏强调:“一定要做模型的服务,不是说把产品光扔给企业就可以了,企业玩不转白搭,他花了钱反过头来还会告诉你不好用。”目前,智谱正在大力推进 AI 技术的整体服务,包括提供工具和平台,提供案例和解决方案,提供更好的经验,让更多的人能够把买来的模型或者开源模型真正地用起来。华尔街见闻获悉,目前,智谱已携手金融、教育、医疗、政务、企服等领域的合作伙伴,共同推进 AgenticLLM 的落地应用。今年 2 月,智谱和三星官宣了基于 Agentic LLM 的相关合作,将 Agent 体验带到三星最新手机 Galaxy S25 系列上。同时,智谱也相继与北京、杭州、上海、成都、珠海等城市达成合作。智谱也在积极出海,当天,由智谱主导,来自东盟十国及 “一带一路” 沿线的 10 个国家共同发起了 “自主大模型国际共建联盟” 正式成立,帮助 “一带一路” 国家建立自主 AI,构建可控的国家级 AI 基础设施。对于商业化方面,智谱去年整体实现了超过 100% 的增长速度,很多头部行业已经打进去,有一定规模化的效果。对于今年的预期,张鹏表示,经过再一次科普,会让市场呈十倍以上的增长,会有更大的机会存在。“整个模式和商业路径会有一些变化,我们会做调整。但是我们还是保持一贯的稳定的商业化落地的速度和效益,持续提升商业化落地的效果。” 张鹏表示。当谈到公司目前的战略重心时,张鹏对华尔街见闻表示,智谱把自己定位成技术驱动的公司,另外一条腿是商业化路径,这两条腿并不是互相矛盾的,也不是互相争抢资源,处于动态调整的过程。张鹏进一步表示:“技术的推进和演进,到了一个必须深入到产业和应用当中去,吸取营养回馈技术研发,所以才会从去年开始大力推进产业化、商业化落地这件事情,会有一些资源的投入。但是从整体的核心任务和资源投入角度来讲,我们更多的资源还是投入在技术研发、创新这一块更高一些。”这场通往 AGI 的竞赛仍处于早期,对智谱来说,虽然已经探索到 L3-Agentic LLM 阶段,但未来的路仍然充满荆棘,要想在全球范围内实现更大的创新,还要全力以赴。