
首銷備貨 50 萬台,豆包 AI 手機要賣給誰?

字節跳動豆包團隊發佈豆包手機助手技術預覽版,與中興合作推出工程樣機 nubia M153,售價 3499 元。豆包手機助手基於豆包大模型和手機廠商授權,旨在重構移動互聯網交互邏輯。首銷備貨 50 萬台,目標是從極客玩具走向更廣泛的用户市場。
12 月 1 日,字節跳動豆包團隊發佈豆包手機助手技術預覽版。
據介紹,豆包手機助手,是在豆包 APP 的基礎上,和手機廠商在操作系統層面合作的 AI 助手軟件。基於豆包大模型的能力和手機廠商的授權,豆包手機助手能夠為用户帶來更方便的交互和更豐富的體驗。
現階段,開發者和科技愛好者可以在豆包與中興合作的工程樣機 nubia M153 上,體驗豆包手機助手的技術預覽版本。目前該版本已面向開發者和科技愛好者少量發售,售價 3499 元。
豆包手機助手的出現,是在試圖用 AI Agent 打通 APP 之間,重構移動互聯網的交互邏輯。
儘管當前的演示仍需面對技術「不確定性」的免責聲明,但這種深入操作系統底層、追求「意圖直達服務」的嘗試,可能比單純的 Chatbot 更具革新意義。

豆包手機外觀設計 |圖片來源:豆包官方
或許,誰能率先解決「操作手機」的穩定性難題,誰就能定義 AI 時代的「iPhone 時刻」。
此前,據前中興手機硬件產品經理向「極客公園」介紹,字節跳動與努比亞為這款手機的首銷備貨量為 50 萬台,併為此訂購了對應數量的手機關鍵元器件。
目前的手機市場中,國產品牌主流旗艦,首銷期備貨通常在 200-300 萬台級別。因此豆包手機的這個數據雖然無法與年出貨量超千萬的一線手機廠商旗艦手機相提並論。但豆包手機擺脱「極客玩具」,走向更廣泛的用户市場的目標已經足夠清晰。
首銷備貨 50 萬台的量級,如果全部投放向市場的話,仍然是一個足以給行業帶來一定影響的數字:作為對比,曾經遊戲手機垂直市場下的頭部玩家 —— 黑鯊,在 2022-2023 年的手機出貨量為 100-150 萬台。
01 從「對話框」到「行動派」
過去兩年,我們見慣了能寫詩、能畫圖的 Chatbot,但對於普通用户而言,手機上最痛的痛點往往是繁瑣的操作流。豆包手機助手這次的大看點,在於它試圖從「對話」跨越到「行動」。
在技術預覽版的演示中,豆包展示了一種在此前 GUI Agent(圖形用户界面代理)研究中常被提及的能力——它能像人類一樣「看懂」屏幕,並直接模擬點擊操作。
這種「看懂屏幕」並模擬人類操作的底氣,則源自豆包大模型在多模態能力上的積累。
據官方透露,該模型在視覺理解、推理以及圖像創作等維度的性能已處於國際第一梯隊。正是因為模型具備了精準的圖形界面(GUI)識別能力,它才能在多項權威評測中拿到高分,從而像人類一樣理解「按鈕」和「輸入框」的含義,而不僅僅是識別一堆代碼。
據豆包手機官方使用文檔介紹,豆包會根據意圖自動判斷是否調用 AI Agent 能力,若用户對話開頭包含「幫我操作手機」,則會 100% 通過 AI 操作手機完成任務。
任務描述越詳細,它的執行效率越高,執行效果越好。例如:「打開美團外賣幫我把最近幾個訂單的好評寫了」。此外,AI 操作手機是在虛擬屏操作的,不會在前台默認展開,也不會影響正在進行的其他任務,你可以隨時返回桌面使用其他應用。
用户也可以直接跟豆包對話,講出需求,豆包可根據需求自動判斷是否通過操作手機功能完成,以及在豆包對話框底部功能按鈕中找到「操作手機」,點擊按鈕可手動描述需求,也可以設定定時等條件任務。
試想這樣一個場景:你在社交媒體上被種草了一款好物,過去你需要截圖、退出應用、打開電商平台、搜索、比價。
而在豆包的演示中,你只需説一句「幫我在全平台比價下單」,AI 就能自動跨應用跳轉,搜索同款、對比價格規格、領券,甚至幫你選好最低價的商品填入購物車。

圖片來源:豆包手機使用指南文檔
雖然出於安全考慮,支付環節仍需人工確認,但前面那一系列機械的點擊和切換,AI 已經代勞了。
甚至複雜任務也可以執行。在官方演示的旅行規劃場景中,當用户提出「下個月去巴黎,幫我把收藏的餐廳標在地圖上,看看哪天有展並訂票」這樣一句包含多重意圖的指令時,AI 能夠迅速將需求拆解為 6 個子任務:從查詢社交媒體收藏、到高德地圖標記、再到攜程訂票,最後整理進備忘錄。
這種跨應用、多步驟的「任務鏈」執行能力,可以説是 AI 從「玩具」邁向「工具」的關鍵分水嶺之一。
為了實現這種「類人」的交互,豆包打通了系統層面的多項權限。
在系統層面,豆包手機為 AI 能力設計了多種交互方式,用户可以通過側邊鍵、語音甚至耳機喚醒它;在相冊裏,它能直接聽懂「把路人 P 掉」的指令並執行。

圖片來源:豆包手機使用指南文檔
在更復雜的「Pro 模式」下,它還能調用系統工具,結合記憶功能,直接完成「推薦禮物並放入購物車」這種需要多步推理的複雜任務。

圖片來源:豆包手機使用指南文檔
當然,將屏幕控制權和個人喜好交給 AI,隱私安全始終是繞不開的話題。所以豆包團隊也強調,這一功能支持按需開啓,並承諾嚴格保護數據隱私。
作為「技術預覽版」,豆包團隊也在視頻結尾特別提示,受限於大模型技術的不確定性,演示中的「絲滑」體驗目前還無法百分百復現,產品距離團隊的最終預期仍有差距。
這也體現了 AI Agent 目前最真實的狀態:方向極度性感,但落地仍需時間打磨。
02 不造硬件的「第三條路」

圖片來源:Google
豆包選擇了第三條路:不做硬件,只做生態。
在發佈預覽版的同時,豆包方面明確表示「沒有自研手機計劃」。他們的策略非常務實——通過與多家手機廠商洽談,以「操作系統層面合作」的形式,將豆包的大模型能力植入不同品牌的機型中。
這種「手機廠商 + 大模型廠商」的深度耦合,正在成為行業的一股新趨勢。
就像谷歌 Gemini 與三星的合作一樣,術業有專攻正逐漸成為共識。
對於手機廠商而言,從零打造一個具備頂級推理、視覺理解和複雜任務規劃能力的模型成本極高;而對於字節跳動這樣的互聯網巨頭,缺乏硬件載體則會讓 AI 始終隔着一層 APP 的玻璃牆,無法觸達用户最核心的數據和場景。
目前的 nubia M153 工程機只是一個開始。售價 3499 元的門檻或許更多是面向開發者和極客人羣的「邀請函」,旨在驗證這種跨界合作的技術可行性與用户反饋。
03 光做一個 APP,在 AI 時代已經不夠了
大模型的能力越來越強,單純做一個 APP,在 AI 時代已經不夠了。
AI Agent 需要接管更復雜的任務、感知更豐富的上下文,發揮一些真實的功能,才有更落地的價值,這意味着它必須走出軟件的圍牆,向下沉澱,與操作系統的底層權限和硬件能力進行深度整合。
過往,字節跳動一直是一支強大的「空軍」——擁有極致的算法和龐大的應用生態,但在操作系統和終端硬件上,相比擁有 Android 的谷歌或擁有全場景終端的華為,字節始終缺少一塊落地的「陣地」。
在移動互聯網時代,這或許不是問題,但在 AI 需要深度介入用户場景的當下,缺乏硬件載體可能意味着喪失對場景的感知力。
豆包手機助手的推出,像是字節在當下階段拋出的一次探索。
從 Pico 到 Ola Friend,再到如今深入手機 OS 層的助手,字節正在小心補齊「硬件觸點」這塊短板。
這或許並不是未來兩三年行業的最終形態,但至少可以確認的是:字節已經意識到,想要讓 AI 真正跑通,必須邁出「軟硬結合」的這關鍵一步。
本文來源:極客公園

