作者 | 黄昱、王小娟编辑 | 周智宇科技巨头们都在瞄准 AI 时代的超级入口——AI Agent 火力全开,当前这一战场上不仅聚集了像腾讯、阿里、字节这样的互联网大厂,也有华为、荣耀、OPPO、vivo 等手机厂商,更有一大批 AI 厂商和硬件厂商。在移动互联网生态中,APP 开发者一般会被视为数据控制者。而随着 AI 时代的到来,系统级 AI 能力被视为下一代设备的灵魂和核心壁垒,终端厂商将通过布局端侧 AI 掌握全局信息,其数据控制者的角色也将是确定的。 在终端设备上缺乏权限的 AI Agent(智能体)很难真正自主干活。要想能重塑未来的软件生态,AI Agent 厂商与手机终端设备厂商合作,从系统层面掌握全局信息,成为一大突破口。在此背景下,12 月 1 日,字节发布豆包手机助手技术预览版,这款与手机厂商在操作系统层面合作的 AI 助手软件已经搭载在中兴通讯的工程样机上。并且字节方面还表示,还在与多家手机厂商谈合作。AI Agent 将给各行各业带来前所未有的变革,同时也将改写整个硬件及软件行业地位商业生态。然而,面对诸多利益,各方力量必然将展开一场激烈的博弈。豆包添了一把火就在豆包手机助手发布前夕,市场关于字节跳动将自研 AI 手机的传闻不绝于耳。此前有产业链消息称,字节跳动正与老牌通信厂商中兴通讯联手打造 AI 手机,预计将于 12 月初正式发布。然而,字节跳动最终选择了截然不同的路径。豆包明确表示 “没有自研手机计划”,而是聚焦于与手机厂商的合作。这种合作模式类似于谷歌 Gemini 与三星的合作关系,豆包提供 AI 能力,手机厂商提供硬件载体。中兴通讯执行副总裁、首席运营官谢峻石曾在今年 4 月底表示:“AI 很有可能给端侧带来整个的升级。” 这一表态为双方合作埋下了伏笔。根据官方演示,豆包手机助手深度集成到手机操作系统中,用户可通过语音、侧边键或豆包 Ola Friend 耳机直接唤醒豆包。它能够读取屏幕内容,跨应用调用服务,甚至完成全平台比价下单等复杂任务。在豆包助手与中兴的合作背后,是 2025 年 AI 技术全面融入实体经济的关键转折点。 行业竞争已从单一技术参数比拼,升级为大模型、APP、硬件终端三大入口的生态化布局。三者相互渗透,形成 “技术 - 场景 - 硬件” 的闭环体系。大模型作为底层技术核心,正通过两种路径产业化:一是通用大模型的平台化扩张,二是垂直领域大模型的深度定制。在通用大模型方面,国内代表性的有字节的豆包大模型、阿里云的通义大模型、腾讯混元大模型等。在垂直大模型领域,各代表公司也已通过与自家业务结合,发布面向自身行业的大模型产品。另一个代表性入口表示应用 APP。APP 作为用户直接触点,正从被动工具演变为具备自主决策能力的 “智能体”(Agent),成为大模型落地的重要载体。去年以来,豆包就成为不少用户手机上最常使用的 AI 类 APP;今年开年之后,DeepSeek 横空出世,进而进入更多人的手机。据市场研究机构 QuestMobile 数据显示,截至 2025 年 9 月,我国 AI 应用移动端月活跃用户规模已突破 7.29 亿大关,PC 端为 2 亿。 最近,阿里发力 C 端,千问 APP 在公测一周之后,下载量便超过 1000 万,更是将 APP 这一 AI 入口推向高潮。而作为各大互联网公司重金押注的领域,AI 入口的每一个方向,各家都有所布局。在技术和应用场景之外,直接嵌入硬件,打造 AI 终端,便是各玩家的最新考量方向。如今,豆包手机助手嵌入手机操作系统,便是 AI 以终端为入口的方向。除了 AI 手机,AIPC 也是这两年行业推出的产品主打的口号,过去一年,不少玩家已经推出相关的概念产品。此外,几天之前,夸克发布了 AI 眼镜,为行业正在酝酿的百镜大战添上新的注脚。而 AI 眼镜能如此备受关注,是因为其也被认为是 AI 终端当中,能改变用户交互方式的产品之一。面向更长远的未来,人形机器人、Robotaxi 等终端,也被认为是重要的 AI 终端。从技术到应用,再到 AI 终端,当前 AI 已经走到落地赚钱的关键阶段。科技巨头们也明白,技术之争是重要的,但终究还是要手握更多 AI 入口,吸引大量用户,并且将入口优势转化为可持续的生态优势,才是长期竞争的关键。各方激烈博弈这场 AI 超级入口之争,目前已经席卷了 AI 厂商、硬件厂商、传统 APP 开发者等多方势力。没有人敢置身事外,因为这不仅是对下一代超级流量入口的争夺,也是对 AI 时代话语权的争夺。AI 大模型在给终端设备带来前所未有的变革的同时,也在改变过去移动互联网生态中,APP 开发者作为数据控制者的角色定位,以及改写 APP 的商业生态。在 AI Agent 为 “指挥官” 的生态下,终端设备厂商或者是 AI Agent 的实际掌控者无疑将拥有最大的 APP 推荐权。前不久特斯拉 CEO 马斯克还预测了一个激进的未来:未来 5-6 年,传统手机与 App 将消失,人类所消费的大多数内容都将由 AI 生成。然而当前来看,一款真正好的终端 AI Agent,除了更自主感知外,还需要打通第三方 APP、打破单个 APP 的数据割裂,构建起接入第三方 APP 的 AI 生态。为了达成这一目标,市场上现有两条技术分支:一是意图框架,需要第三方 App 授权,但技术相对成熟,硬件算力要求低;二是,纯视觉方案,无需授权,但技术仍有待提升,硬件算力要求更高。然而,这两条路线目前来看都不太容易做好。第一条技术路线的阻碍显而易见,那就是在利益冲突、数据安全等问题下,第三方 APP 并不一定愿意向 AI Agent 开放授权。而纯视觉方案则面临着法律与合规的复杂挑战。有开发者告诉华尔街见闻,纯视觉方案可以简单理解为读屏和模拟用户点击的方案,而国产安卓厂商读屏方案主要有两条技术路径:一条是通过录屏的形式读取屏幕信息;另一条是 API Hook(API 钩子)形式,这二者都需要获取无障碍等系统级权限。无障碍权限原本是安卓系统给残障人士设置的特殊端口,可以帮助用户实现朗读屏幕、语音控制点击等。以往,当用户买到一部手机,无论苹果 IOS 还是安卓系统都内置了 “App 沙箱隔离机制” ,阻止各个 App 相互读取数据;以及 “权限控制框架” 约束手机厂商也不能在未经用户同意的情况下获取敏感信息。随着 AI Agent 时代的到来, 现有法律框架面临严峻挑战,难以直接套用,一套全新的规范亟待建立。今年被视作 AI Agent 元年,一切都才刚刚开始,相关商业合作模式和数据隐私保护的责任边界都仍在探索阶段。 面对这一时代洪流,所有人都无法置身事外,必须共同努力在技术创新与防范风险之间找到新的平衡点。