作者 | 黃昱、王小娟編輯 | 周智宇科技巨頭們都在瞄準 AI 時代的超級入口——AI Agent 火力全開,當前這一戰場上不僅聚集了像騰訊、阿里、字節這樣的互聯網大廠,也有華為、榮耀、OPPO、vivo 等手機廠商,更有一大批 AI 廠商和硬件廠商。在移動互聯網生態中,APP 開發者一般會被視為數據控制者。而隨着 AI 時代的到來,系統級 AI 能力被視為下一代設備的靈魂和核心壁壘,終端廠商將通過佈局端側 AI 掌握全局信息,其數據控制者的角色也將是確定的。 在終端設備上缺乏權限的 AI Agent(智能體)很難真正自主幹活。要想能重塑未來的軟件生態,AI Agent 廠商與手機終端設備廠商合作,從系統層面掌握全局信息,成為一大突破口。在此背景下,12 月 1 日,字節發佈豆包手機助手技術預覽版,這款與手機廠商在操作系統層面合作的 AI 助手軟件已經搭載在中興通訊的工程樣機上。並且字節方面還表示,還在與多家手機廠商談合作。AI Agent 將給各行各業帶來前所未有的變革,同時也將改寫整個硬件及軟件行業地位商業生態。然而,面對諸多利益,各方力量必然將展開一場激烈的博弈。豆包添了一把火就在豆包手機助手發佈前夕,市場關於字節跳動將自研 AI 手機的傳聞不絕於耳。此前有產業鏈消息稱,字節跳動正與老牌通信廠商中興通訊聯手打造 AI 手機,預計將於 12 月初正式發佈。然而,字節跳動最終選擇了截然不同的路徑。豆包明確表示 “沒有自研手機計劃”,而是聚焦於與手機廠商的合作。這種合作模式類似於谷歌 Gemini 與三星的合作關係,豆包提供 AI 能力,手機廠商提供硬件載體。中興通訊執行副總裁、首席運營官謝峻石曾在今年 4 月底表示:“AI 很有可能給端側帶來整個的升級。” 這一表態為雙方合作埋下了伏筆。根據官方演示,豆包手機助手深度集成到手機操作系統中,用户可通過語音、側邊鍵或豆包 Ola Friend 耳機直接喚醒豆包。它能夠讀取屏幕內容,跨應用調用服務,甚至完成全平台比價下單等複雜任務。在豆包助手與中興的合作背後,是 2025 年 AI 技術全面融入實體經濟的關鍵轉折點。 行業競爭已從單一技術參數比拼,升級為大模型、APP、硬件終端三大入口的生態化佈局。三者相互滲透,形成 “技術 - 場景 - 硬件” 的閉環體系。大模型作為底層技術核心,正通過兩種路徑產業化:一是通用大模型的平台化擴張,二是垂直領域大模型的深度定製。在通用大模型方面,國內代表性的有字節的豆包大模型、阿里雲的通義大模型、騰訊混元大模型等。在垂直大模型領域,各代表公司也已通過與自家業務結合,發佈面向自身行業的大模型產品。另一個代表性入口表示應用 APP。APP 作為用户直接觸點,正從被動工具演變為具備自主決策能力的 “智能體”(Agent),成為大模型落地的重要載體。去年以來,豆包就成為不少用户手機上最常使用的 AI 類 APP;今年開年之後,DeepSeek 橫空出世,進而進入更多人的手機。據市場研究機構 QuestMobile 數據顯示,截至 2025 年 9 月,我國 AI 應用移動端月活躍用户規模已突破 7.29 億大關,PC 端為 2 億。 最近,阿里發力 C 端,千問 APP 在公測一週之後,下載量便超過 1000 萬,更是將 APP 這一 AI 入口推向高潮。而作為各大互聯網公司重金押注的領域,AI 入口的每一個方向,各家都有所佈局。在技術和應用場景之外,直接嵌入硬件,打造 AI 終端,便是各玩家的最新考量方向。如今,豆包手機助手嵌入手機操作系統,便是 AI 以終端為入口的方向。除了 AI 手機,AIPC 也是這兩年行業推出的產品主打的口號,過去一年,不少玩家已經推出相關的概念產品。此外,幾天之前,夸克發佈了 AI 眼鏡,為行業正在醖釀的百鏡大戰添上新的註腳。而 AI 眼鏡能如此備受關注,是因為其也被認為是 AI 終端當中,能改變用户交互方式的產品之一。面向更長遠的未來,人形機器人、Robotaxi 等終端,也被認為是重要的 AI 終端。從技術到應用,再到 AI 終端,當前 AI 已經走到落地賺錢的關鍵階段。科技巨頭們也明白,技術之爭是重要的,但終究還是要手握更多 AI 入口,吸引大量用户,並且將入口優勢轉化為可持續的生態優勢,才是長期競爭的關鍵。各方激烈博弈這場 AI 超級入口之爭,目前已經席捲了 AI 廠商、硬件廠商、傳統 APP 開發者等多方勢力。沒有人敢置身事外,因為這不僅是對下一代超級流量入口的爭奪,也是對 AI 時代話語權的爭奪。AI 大模型在給終端設備帶來前所未有的變革的同時,也在改變過去移動互聯網生態中,APP 開發者作為數據控制者的角色定位,以及改寫 APP 的商業生態。在 AI Agent 為 “指揮官” 的生態下,終端設備廠商或者是 AI Agent 的實際掌控者無疑將擁有最大的 APP 推薦權。前不久特斯拉 CEO 馬斯克還預測了一個激進的未來:未來 5-6 年,傳統手機與 App 將消失,人類所消費的大多數內容都將由 AI 生成。然而當前來看,一款真正好的終端 AI Agent,除了更自主感知外,還需要打通第三方 APP、打破單個 APP 的數據割裂,構建起接入第三方 APP 的 AI 生態。為了達成這一目標,市場上現有兩條技術分支:一是意圖框架,需要第三方 App 授權,但技術相對成熟,硬件算力要求低;二是,純視覺方案,無需授權,但技術仍有待提升,硬件算力要求更高。然而,這兩條路線目前來看都不太容易做好。第一條技術路線的阻礙顯而易見,那就是在利益衝突、數據安全等問題下,第三方 APP 並不一定願意向 AI Agent 開放授權。而純視覺方案則面臨着法律與合規的複雜挑戰。有開發者告訴華爾街見聞,純視覺方案可以簡單理解為讀屏和模擬用户點擊的方案,而國產安卓廠商讀屏方案主要有兩條技術路徑:一條是通過錄屏的形式讀取屏幕信息;另一條是 API Hook(API 鈎子)形式,這二者都需要獲取無障礙等系統級權限。無障礙權限原本是安卓系統給殘障人士設置的特殊端口,可以幫助用户實現朗讀屏幕、語音控制點擊等。以往,當用户買到一部手機,無論蘋果 IOS 還是安卓系統都內置了 “App 沙箱隔離機制” ,阻止各個 App 相互讀取數據;以及 “權限控制框架” 約束手機廠商也不能在未經用户同意的情況下獲取敏感信息。隨着 AI Agent 時代的到來, 現有法律框架面臨嚴峻挑戰,難以直接套用,一套全新的規範亟待建立。今年被視作 AI Agent 元年,一切都才剛剛開始,相關商業合作模式和數據隱私保護的責任邊界都仍在探索階段。 面對這一時代洪流,所有人都無法置身事外,必須共同努力在技術創新與防範風險之間找到新的平衡點。