作者 | 黄昱 互联网大厂将齐聚在又一个火热的新战场——桌面 Agent。 2 月 6 日,当 “腾讯云代码助手 CodeBuddy” 官方账号正式宣布桌面 Agent 工具 “WorkBuddy” 启动内测时,这场备受关注的 “桌面大考”,又迎来了一个重量级玩家。 腾讯云 CodeBuddy 团队对华尔街见闻表示,WorkBuddy 在腾讯内部很早就推出了,旨在帮助公司内非开发者也能提高日常的效率。如今看到很多办公人群、研究人群、各行各业,对于 “应用来解决日常任务” 的诉求越来越强烈,所以基于 CodeBuddy 目前成熟的 AI Coding 基建,推出了轻量便捷极简的产品设计风格。 “我们会继续深度打磨用户反馈,然后在上半年找合适的时间正式推出这个产品。” 与时下火热的 OpenClaw 能够调取系统级权限和更灵活的操作不同,WorkBuddy 的定位更多是 “通过读取电脑上的经授权文件夹,实现多类自主操作”。 这意味着,WorkBuddy 的场景更多是明确文件夹约束下的有限操作。 这或许也折射了腾讯在该领域的 “减法式” 产品思考——它假设大多数职场人不仅关心 “能不能把事做完”,也担心 AI 会不会捅娄子,于是选择的产品路线并不激进,而是看重稳定、可复用、可交付的执行结果。 WorkBuddy 的推出,不仅标志着腾讯正式加入桌面 Agent 工具的市场竞争,更可视为大厂试图通过 “智能体” 这一新变量,重新定义职场效率边界的重要信号。 腾讯入局的时机,恰好踩在了全球桌面 Agent 爆发的临界点上。 就在不久前,OpenClaw 等产品在技术社区迅速走红,用户惊叹于 AI 能够深度访问电脑系统、文件、甚至自主执行跨应用任务。 这种被称为 “24 小时待命贾维斯” 的体验,让业界直言 “桌面 Agent 的 ChatGPT 时刻” 已经到来。 相比于目前市面上火爆的同类工具,WorkBuddy 没有走纯极客路线,而是定位为面向非技术背景的职场人群。 这意味着,它不再要求用户具备编程知识,只需要通过自然语言描述需求,它就能像一个 “懂行” 的同事一样去执行任务。这种从 “技术工具” 向 “职场助手” 的范式转移,是腾讯对桌面 Agent 大众化的一次大胆尝试。 据介绍,WorkBuddy 可以直接在本地电脑自主规划并执行多模态复杂任务。具体来看,WorkBuddy 具备两大特点: 一是深度本地操作能力:,能够 “听懂人话” 并 “真能操作本地文件”。 在获得授权后,它可以读取文件夹、批量处理文件、生成文档或 PPT 数据深度分析、行业调研、多任务 Agent 并行处理等。这意味着,它打破了传统 AI“只能看、不能动” 的尴尬局面,真正切入了办公的最后一公里。 二是多步骤任务的自主规划,与简单的指令响应不同,WorkBuddy 强调 “带脑子思考”。 此外,WorkBuddy 还内置了多种海内外的模型和主流 MCP Server 和 Skills 技能包等高阶功能,这使其在保持简单易用的同时,具备了极强的扩展性,能够应对金融、调研、创作等垂直细分场景的深度需求。 华尔街见闻获悉,WorkBuddy 由腾讯云 CodeBuddy 团队开发,此前已在腾讯内部推出并启动内测,目前已经有超过 2000 名不同岗位员工参与深度使用,并在数据处理与分析、构建本地知识库、内容文案创作、海报生成、自动化办公等场景获得广泛应用。 长期以来,尽管大模型在对话框里表现得无所不知,但当用户回到真实的办公场景,面对繁杂的本地文件、琐碎的多任务切换时,大模型往往显得 “手脚受限”。 如今,随着 AI 竞争进入下半场,行业竞赛的焦点正在从 “比拼模型参数” 转向 “比拼落地能力”。单纯的聊天机器人已经无法满足职场人复杂、细碎且极度依赖本地文件的需求。谁能先占据用户的电脑桌面,谁就拿到了通往下一代 “AI 操作系统” 的门票。 OpenClaw 等工具的爆红已经证明了用户对于 “能跑在自己电脑里、深度操作应用” 的 Agent 有着极度饥渴的需求。 腾讯此时出手,既是为了在一众先行者的包围中抢占生态位,也是为了将其深耕多年的企业服务能力,通过 Agent 这一载体进行智能化升级。 然而,在市场情绪被再次点燃的背后,WorkBuddy 以及一众桌面 Agent 玩家也面临着挑战。 首当其冲的便是 “越权” 与 “隐私” 的博弈。桌面 Agent 的核心价值在于深度访问用户的电脑系统、文件和应用,这种深度的互动意味着用户必须让渡极高的系统权限。正如业界对 OpenClaw“24 小时待命贾维斯” 的期待一样,越是强大的 Agent,其掌握的个人偏好和本地项目数据就越详尽。 如何在提供便利的同时,确保这些敏感数据不被滥用或在网络传输中泄露,将是 AI Agent 产品必须面对的合规 “生死线”。 腾讯云 CodeBuddy 团队告诉华尔街见闻,WorkBuddy 背后依靠 CodeBuddy 的安全保护机制,并通过 “沙盒隔离 + Skill 标准化 + 危险操作拦截” 的多层防御策略来应对桌面 Agent 的部署挑战。 其核心思路是:"授权信任并验证" —— 信任用户指令意图,通过用户授权验证执行安全性和危险操作黑名单兜底机制。 此外,Agent 与底座模型之间的 “父子关系” 也决定了其能力的上限与下限。 尽管桌面 Agent 可以通过工程手段优化执行路径,但 Agent 的基础能力依然由底层大模型施展。一旦底层模型出现 “幻觉” 或逻辑断裂,Agent 在自动执行任务中或许也会带来严重后果。 更值得一提的是,桌面 Agent 的兴起,本质上是在重构人与计算机的交互关系。过去以来用户是应用之间的 “搬运工”,在浏览器、办公套件和沟通工具间来回穿梭;而随着 WorkBuddy 这类桌面 Agent 的普及,未来的交互范式可能变为 “以任务为中心”。 当一个 Agent 能够跨越应用、代表用户完成批量取消邮件订阅或整理价格差异等复杂任务时,传统的应用软件可能会逐渐沦为 Agent 调用的 “技能包”。这意味着,未来的桌面生态竞争,可能不再是软件功能的堆砌,而是谁的接口更利于 Agent 调用,谁能提供更适配 AI 的操作环境。 从全球范围来看,桌面 Agent 的竞争才刚刚拉开大幕。不止 Manus、OpenClaw、Claude Cowork 等,还有其它不少同类产品纷纷抢滩上线。 当 AI 真正接管了我们的鼠标和键盘,那是效率的极致提升,也是对数字安全底线的全新考验。随着 “桌面 Agent 大战” 的硝烟四起,一场关于生产力范式的变革,已然兵临城下。