作者 | 黄昱 编辑 | 张晓玲 十八年前,苹果凭借一款 iPhone,将手机带入了一个由独立 APP 组成的智能时代,建立起了沿袭至今的 “围墙花园” 生态。十八年后,软件生态变革信号再次响起,但这一次,战火的引燃者并非硬件巨头,而是试图改写软件秩序的新一代互联网大厂。 12 月 1 日,字节跳动联合中兴通讯推出的 “豆包手机”——nubia M153,在整个科技圈掀起了巨浪。这款在系统中深度嵌入豆包手机助手的手机,甫一问世,便火到 3 万台首批备货被一抢而空。 与此同时,豆包挑动了整个移动互联网生态最敏感的神经。 豆包手机助手是一个拥有系统级权限、能模拟人类操作的 “AI 指挥官”,直接挑战了 APP 开发者作为 “数据控制者” 的传统地位,引爆了关于数据授权、隐私侵犯和系统安全的激烈争议,也动摇了超级 APP 的商业生态和流量根基。 目前,微信、淘宝以及一些银行 APP 等都设置了 “安全防火墙”,开启了对豆包手机助手的反制和围剿。 已将豆包推到国内 AI 原生应用第一位置的字节跳动,以 “工程样机” 的方式成功让更多人看到了 AI Agent 跨 APP 操作的能力,也宣告了下一代超级入口之争的全面升级。 字节的进攻和腾讯的防守,好似多年前的头腾大战重演,从移动互联网时代到 AI 时代,科技巨头对超级流量入口的争夺从未停止。 这不仅是一场技术路线的较量,更是一场涉及手机硬件制造商、互联网大厂、AI 创业公司等多方利益的博弈。在这场关乎未来软件生态秩序的重塑之战中,没有任何一方可以抽身。 上帝之手 在传统的智能手机上,一个个 APP 仿佛一个个孤岛,它们之间信息不通,互相隔离,目的是保护用户隐私,以及操作自主性,这就是在漫长的手机发展史中,逐渐形成的沙盒隔离机制。 然而在这款合作手机上,豆包手机助手扮演了 “AI 指挥官” 角色,它能在一句话的指令下,跨应用调用服务,以帮助用户点外卖、订机票、比价购物,甚至回复微信消息、操作小程序游戏等。 豆包手机助手是通过系统级权限 INJECT_EVENTS 实现跨应用自动化操作的,该权限被安卓生态视为 “上帝之手”,可模拟用户点击并读取屏幕内容,其核心能力在于打破了移动互联网时代 APP 之间的壁垒。 这正是 AI Agent 试图取代传统 APP、成为用户任务管家的革命性体现。然而,这种跨应用能力,迅速遭到了来自既有生态巨头的抵制。 作为国民级应用,微信成为一些豆包手机用户最早发现不授权豆包手机助手操作的应用。 12 月 2 日晚,多位用户反馈,在 nubia M153 上使用豆包手机助手操作手机功能时,如果涉及操作微信,会出现微信异常退出,甚至无法登录的情况。 微信相关人士对华尔街见闻表示:“没有什么特别的动作,可能是中了本来就有的安全风控措施”。 据华尔街见闻了解,后续淘宝也出现了用豆包手机助手会出现频繁跳人机验证提示,或者闪退或强制账号登出。 同时,以建行、招行为代表的银行类 APP 则会提示在录屏等状态下无法使用 APP。 这一系列情况都暴露了 AI Agent 在落地上面临的法律和合规困境。 对于这些问题,豆包目前都做出了回应。 12 月 3 日晚,豆包手机助手团队发文称,在收到用户反馈后,豆包后续下线了手机助手操作微信的能力,目前,nubia M153 上被禁止登录的微信账号正陆续解封,用户可等待一段时间并尝试重新登录。 豆包方面表示,目前行业的 AI 助手,均需使用 INJECT_EVENTS 系统级权限(或与其类似的无障碍权限),实现跨应用自动操作;而调用该权限则需要用户授权,豆包手机助手在权限清单中都有披露。 这也是当前各大 APP 和豆包之间存在的争议点,用户授权是否就能代替第三方平台授权?显然微信和淘宝等并未放行。 为了平息风波,豆包表示非常重视用户隐私,比如,屏幕和操作过程都不会在云端服务器存储,且所有的相关内容也都不会进入模型训练,确保用户隐私安全。 同时,豆包也强调,豆包手机助手此次发布的是一个 “技术预览版”,不面向普通的消费者,是一款面向行业、AI 技术爱好者的探索产品,部分功能和交互比较创新,目前也没有明确的行业共识。 在利益冲突、数据安全等问题下,一些第三方 APP 显然不会太愿意向 AI Agent 开放授权。因此,可以看到,豆包选择了一个进可攻退可守的位置,选择以 “工程样机” 来踏出试水的第一步。 安全之重 豆包手机挥出 “上帝之手”,看似打开了潘多拉魔盒,事实上,AI 手机并非豆包首个推出。 2024 年是公认的 “AI 手机元年”,这一年华为、荣耀、OPPO、vivo 等手机厂商相继发布了 AI 手机,将 AI 能力融入系统,也纷纷喊出 “一句话让 AI 手机助手帮你干活” 的口号。 然而,这些尝试大都停留在锦上添花的功能层面,或是需要更多授权的应用调用,更像是移动互联网时代的 “局部优化”,并未真正触及现有 APP 生态的根基,也未能激起用户市场的太大水花。 当触及风控时,微信也会及时反制一些 AI Agent 的相关权限。其实微信封 AI Agent 早有预兆。今年 4 月就警告过第三方工具偷聊天记录,8 月又封一批 AI 权限,连华为小艺、小米小爱都动不了微信。 AI 手机要想成为真正的 AI Agent,市场上现有两条技术分支:一是意图框架,需要第三方 App 授权,但技术相对成熟,硬件算力要求低;二是,纯视觉方案,无需授权,但技术仍有待提升,硬件算力要求更高。 目前来看,手机厂商在 AI Agent 在跨应用操作上明显更谨慎,也因此更倾向于选择意图框架的模式。 以 vivo 为例,去年 vivo 发布了意图框架白皮书,今年,意图框架升级为 2.0,全面兼容 MCP 协议。 同时,vivo 推出适配智能体协议 A2A。vivo 副总裁、OS 产品副总裁、vivo AI 全球研究院院长周围指出:“有了它之后,开发者能够基于 Agent 协议全流程线上化进行智能体的创建和卡片的配置,再通过统一的意图框架和智能体容器在 vivo 全渠道分发。” 不得不承认的是,与更多第三方 APP 达成协议是一件并不容易的事。 为了减少阻力,字节选择了后退一步。12 月 5 日,豆包手机助手宣布,计划在接下来的一段时间,在部分场景,对 AI 操作手机的能力做一些规范化调整,包括限制刷分、刷激励的使用场景,限制金融类应用等。 与此同时,字节有关人士表示,目前正在积极寻求与各应用厂商的深度沟通,希望推动形成更加清晰、可预期的规则,避免用一刀切的方式否定用户合理使用 AI 的权利。 目前来看,在这场 AI 时代话语权的争夺战中,手机厂商、豆包在系统级 AI 能力的探索上,因为授权问题都会面临一定的发展瓶颈。 北京师范大学法学院博士生导师吴沈括指出,AI Agent 是一种创新型效率工具,它是当下业务模式乃至商业生态进一步迭代演进的技术先声。在治理层面,需要各方付诸全面和深度的洞察研判,特别是需要兼顾技术创新与产业利益的平衡。 AI Agent 需要对用户数据、各家 APP 服务有全局的掌握和理解,一旦接入系统侧的大模型获取了全部数据,如何保障用户隐私不被泄露、系统安全不被破坏,成为了悬在所有入局者头上的达摩克里斯之剑。 这场授权与越界的博弈,远未结束。 入口之争 豆包手机助手之所以被推到风口上,除了隐私安全的质疑外,更重要的原因是其正以前所未有的姿态,挑战着延续十余年的移动互联网行业格局。这场战争的核心,是争夺 AI 时代的 “超级流量入口”。 过去多年,自苹果推出智能手机开始,一个遍布数十亿台手机、由无数 APP 组成的超级商业生态已经形成,它包括手机硬件、操作系统以及超级 APP,当然还有背后的网络和电信。 基于一些超级 APP、国民级应用而生的互联网和科技巨头也崛起了。微信、抖音、拼多多、小红书是其中的中国翘楚,淘宝和京东、美团等传统电商、外卖网站,也发展成了超级 APP。 超级 APP 的商业模式核心,是数据和流量。基于此产生的广告、电商、支付等变现模式,目前已经发展成熟,一个超级 APP,动辄就是数万亿的 GMV、数千亿的营收和数百亿的利润。 而豆包试图以 AI 助手身份成为 “流量调度中心”,绕过传统 App 入口,直接调用服务。此举改变了现有 APP 应用分发和使用,冲击了超级 App 的商业模式。 对于淘宝、美团等依赖用户时长、广告曝光和交易佣金的平台而言,AI Agent 的 “跨应用调度” 能力,意味着用户无需打开 APP 即可完成服务消费,这相当于直接抽走了平台的流量根基。 入口是护城河,也是收费站。因此,这场由豆包点燃的新旧势力对抗战,本质上是移动互联网时代的流量 “封地” 领主,对新兴 AI Agent 势力试图 “抢占收银台” 的反击。 自 2022 年底 ChatGPT 掀起 AI 大模型浪潮后,一个共识是,AI Agent 将给软硬件行业带来前所未有的变革。 前不久特斯拉 CEO 马斯克还预测了一个激进的未来:未来 5-6 年,传统手机与 App 将消失,人类所消费的大多数内容都将由 AI 生成。 在重塑人机交互方式的同时,AI Agent 也将改变过去移动互联网生态中,APP 开发者作为数据控制者的角色定位,以及改写手机应用的商业生态,在 “苹果税”、“安卓税” 之后,催生新的商业合作模式。 因此,由豆包发起的战争,是一场守成的 “超级 App” 帝国和新兴 “AI 代理” 模式之间的战争,本质上是对未来超级流量入口的争夺。 字节有其流量焦虑,其主动发起的进攻,碰到了超级 App 的风控壁垒也在所难免。这也并非是微信或淘宝针对豆包的反制,而是新旧模式的争夺。 未来之战 张一鸣还是那个想要砸掉旧世界的人。十多年前,他用抖音颠覆了社交,创造了与微信并行的国民级应用;现在,他又想用豆包助手,抢占 AI 时代的超级流量入口。 豆包主动发起了进攻,微信、淘宝等看似被动防御,但实际上,作为移动互联网时代的霸主,腾讯的马化腾和阿里的马云、甚至百度的李彦宏怎甘落后,他们都有自己的 AI Agent 宏图。 腾讯管理层曾在年初透露,在通用 AI Agent 方面,腾讯正在通过元宝、IMA 等 AI 原生产品构建这种能力,也会发展嵌入微信生态、基于微信独特生态系统运行的 AI agent。 腾讯总裁刘炽平在前不久的财报会上指出,微信最终会推出一个 AI 智能体,帮助用户在微信内部利用 AI 完成很多任务。微信具备通信、社交、内容(公众号、视频号)、小程序、支付与商业五大生态,能使智能体理解用户的需求、意图和兴趣,也能闭环执行任务。 阿里同样提出了构建 AI Agent 的战略规划。如今千问 APP 成为阿里抢夺下一代超级流量入口的先锋,阿里核心管理层将 “千问” 项目视为 “AI 时代的未来之战”,未来,千问还将陆续接入电商、地图、本地生活等阿里业务生态场景。 除大厂外,手握底层操作系统权限的手机厂商,也是试图用 AI 接管手机的一大股势力。AI 助手是手机厂商要做好 AI 手机的关键落地场景,目前手机厂商都以自研为主,如华为小艺、荣耀 YOYO、小米小爱、OPPO 小布等。 字节这次选择和中兴合作开发 AI 手机,一大原因便是中兴没有自己的 AI 助手,这有点像华为的鸿蒙智行一开始,只能找到赛力斯合作一样,大部分主机厂品牌都不愿将自己的 “灵魂” 交给华为,手机厂商也不例外。 事实上,除了中兴,字节背后有着锤子手机的影子。而阿里也已经与苹果手机深度合作,甚至有可能推出自己的手机。 此外,除了手机,智能终端硬件还包括眼镜、车载屏幕、人形机器人等,他们也都需要与 AI 助手达成平衡。 未来,AI 应用与硬件厂商的合作将越来越深入和频繁,甚至有可能自己下场造硬件,比如最近阿里就推出了夸克眼镜,毕竟没有装机量,没有用户,AI 助手无从谈起。 可以想象,在可预见的未来,几个互联网大厂都将有一个能串联起自家生态的 AI Agent,甚至下场造硬件;而一些手机厂商则将通过与更多中小第三方 APP 达成授权,打造出一个更能 “干活” 的系统级 AI Agent。 一个分层的生态或许不可避免:数据隐私安全高度重要的服务如支付、社交等,将由平台牢牢掌控;而低敏感度的场景,如修图、信息查询,则可能向 AI Agent 调度开放。 豆包的这次进攻,微信与淘宝的反制,标志着 AI 手机的发展已经从单纯的技术演示阶段,进入了残酷的 “生态博弈阶段”。豆包的暂时受挫,暴露了技术激进主义在面对庞大既得利益集团时的局限性。 但这场碰撞并非坏事,它将加速整个行业去思考和重构未来的人机交互规则。终端 AI 时代,必然打破传统移动互联网的隐私保护与数据安全秩序,各方必须在协作与竞争中找到新的平衡点;而曾经的智能终端和超级 APP 流量帝国和商业生态,也将被重构。 毋庸置疑的是,AI Agent 的革命性意义已经确定,它正在以不可逆转的力量,重塑软硬件行业的未来面貌,人类与 AI、智能体的交互,也进入了一个新的纪元。 未来已来。字节和豆包手机,只不是那个最先揭开了盖头的人。