--- title: "AI 座艙大戰,火山引擎獨開一桌" type: "Topics" locale: "zh-HK" url: "https://longbridge.com/zh-HK/topics/40200636.md" description: "智能座艙戰場,第一次瀰漫出「羣雄環伺」的殺氣。AI 座艙的主旋律之下,不止一家企業喊出「龍蝦」、「Agent」上車,也不止一家企業自稱造出「中國版 Grok」。但至少一點,智能座艙終於成了「主菜」,它與智能駕駛、動力電池層級並列,構成智能汽車新「三大件」。只不過,大多數人都不知道這道「主菜」究竟該怎麼做。不是堆砌複雜的車控指令..." datetime: "2026-04-25T14:01:21.000Z" locales: - [en](https://longbridge.com/en/topics/40200636.md) - [zh-CN](https://longbridge.com/zh-CN/topics/40200636.md) - [zh-HK](https://longbridge.com/zh-HK/topics/40200636.md) author: "[汽车之心](https://longbridge.com/zh-HK/profiles/3726156.md)" --- # AI 座艙大戰,火山引擎獨開一桌 智能座艙戰場,第一次瀰漫出「羣雄環伺」的殺氣。 AI 座艙的主旋律之下,不止一家企業喊出「龍蝦」、「Agent」上車,也不止一家企業自稱造出「中國版 Grok」。 但至少一點,智能座艙終於成了「主菜」,它與智能駕駛、動力電池層級並列,構成智能汽車新「三大件」。 只不過,大多數人都不知道這道「主菜」究竟該怎麼做。 不是堆砌複雜的車控指令,也不是接入大量娛樂生態就夠了;更不是把 AI 應用塞進車機就叫 AI 原生。這些充其量只是淺層功夫。 好比裹着糖衣的藥丸,糖衣一溶化,用户就不願、也難以再吞下去。 如果智能座艙的目標,是讓用户在「第三空間」裏真正享受生活,它的核心命題應該是,用「真實人格」留住用户。 這也構成了火山引擎在 AI 座艙方向上的底層判斷。 北京車展首日,**火山引擎推出一套基於 Agentic AI 架構的新一代汽車智能解決方案。** 其核心是一個「AI 大腦」,直接顛覆了上一代「意圖分域 + 多 Agent 協同」的語音助手架構,並首次橫向打通車控、導航、智能駕駛等關鍵功能域。 產品形態分為兩條路徑: - **AI 座艙套件。**在既有、已規模量產的「豆包大模型」座艙能力基礎上,完成向 Agentic 架構的升級。車企可以按需組合能力模塊,更像是在調用一套可編排的 AI 基礎設施。 - **豆包座艙助手方案。**一種更接近「交付即用」的產品形態,與豆包 App 實現能力與數據的互通,使車內外體驗形成連續體,並通過統一模型持續迭代。 這套架構背後,是一整套從感知、推理到執行、記憶、學習的系統級閉環。既打通了整車數據鏈路,也讓模型具備長期學習與穩定控制能力。 火山引擎圍繞行業首個全鏈路端到端 AI 座艙架構展開探索,並以「AI 大腦」的思路推進 AI 原生座艙的系統化落地,率先在這一方向完成了能力卡位。 **01、「糖衣」失效,智能座艙的內核是「人格」** 過去三年,智能座艙的發展,有點像在原地打轉。 車企的打法倒是很統一,在一塊中控大屏上,加一套語音系統,然後不斷往裏疊加功能,包括車控指令、娛樂 APP、在線服務等。 對外敍事也固化了。 找一輛上世紀生產的經典 BBA 作對比,過去機械按鍵密集、交互複雜,現在一塊中控屏管所有,語音可以調温度、座椅和音樂。 最後粗暴得出結論,BBA 已經過時,這才叫智能座艙。 現在看,這套邏輯只能成立一半。 用户確實擺脱了早期車機的遲鈍和封閉,但新問題在於,**這套以大屏和語音為核心的體系,用户並沒有真正高頻使用。** 市研機構 J.D. Power 發佈的《2025 中國智能座艙評選白皮書》提供了一個 C 端視角。 在用户滿意度排序中,語音助手已經落到倒數第四名。排在前面的,是智能座椅、充電體驗,以及更偏「物理感受」的功能。 一個直觀結論,**相比可對話,用户更在意可感知、可兑現的實際體驗。** 在火山引擎副總裁楊立偉看來,如果智能駕駛大約在 80 分水平,那麼智能座艙只能得 45 分。 問題出在解題思路上,過去主流廠商的思路是用加法解決問題,功能不斷疊加,但交互邏輯沒有本質變化: 第一,**觸控板菜單變成語音版菜單。** 語音系統的能力在增強,但使用方式沒有改變。用户仍然需要組織明確指令,甚至接近「標準句式」。一旦表達偏離預設路徑,系統就會出現識別失敗或響應遲緩。 第二,**生態無效擴充。** 視頻、遊戲、K 歌等內容被持續引入車機系統,以為能用互聯網內容提升用户使用時長。 但低估一點,車機並不是一個內容優先的設備,手機完成生態積累與用户習慣培養後,車機很難在同一維度競爭,就像用户絕對不會因為在車裏能刷短視頻就放下手機。 大多時候,車機更像是手機的一個替代選項,而非首選入口。 第三,**無意義的 AI 外掛。** 去年初一波「DeepSeek 上車」熱潮,後續水花減弱。本質原因就是除了能落地對話功能,也難以做出新花樣。 AI 存在於界面中,卻沒有進入系統深層,更像是 AI 套殼座艙。 三條路徑雖擴展能力邊界,卻沒有改變交互核心,還是需要用户主動發起操作。 功能新鮮感的「糖衣」褪去後,用户很難對一個「沒有感情」的工具產生粘性,更何況,工具還不好用。 事實上,今天 AI 浪潮的走向,已經明示了產生用户粘性的最佳答案。 一波是「豆包」熱,QuestMobile 數據顯示,截止到 2026 年 3 月,AI 原生 APP 月活用户規模已達到 4.4 億,單豆包月活用户規模就佔到 3.45 億,斷檔第一。 而豆包脱穎而出的核心原因,在於其交互門檻足夠低,可玩性足夠強,用户只需表達模糊意圖,都能開啓對話,並支持圖文、語音、視頻多模態輸入。 另一波是「龍蝦」潮,這類智能體可以直接接管電腦完成任務,捅破了從建議到執行的最後一層窗户紙,進而席捲整個 AI 科技圈。 如果把兩條路徑拆開來看,會更清楚一些。前者解決的是「怎麼交流」,強調自然語義和推理能力。而龍蝦解決的是「怎麼完成」,強調目標驅動和執行能力。 兩者都具備更強的「人格特徵」,也就是理解、記憶和行動。**用户的信任和依賴,往往建立在這三點之上。** 把這個邏輯放到座艙裏,其實就是 AI 座艙的正確解法。 順應着這條思路,火山引擎發佈了新一代豆包座艙助手,需要強調兩點: 一是基於底層的大模型基座,只有火山引擎可以造出豆包 APP 同級智力的座艙系統。 二是相比「龍蝦」,豆包座艙助手不僅交互更為「擬人」,還沒有失控隱患,在安全和隱私上保持更高約束。 準確而言,火山引擎不是把這些能力簡單拼接起來,而是用一個「AI 大腦」整合全部能力,統一處理信息,再去驅動整車各個模塊,這樣邏輯更順,也更接近 AI 原生座艙該有的形態。 **02、從「拼湊智能」到「整車大腦」,豆包座艙助手改變了什麼?** 目前測試語音助手是否好用,一個常見方法是連續輸入多條指令,觀察系統能否穩定響應。 這是個有效方法,但還不夠。很多測試場景,本質還是單一領域,比如連續車控,底層依然是同一套模塊在執行。 如果需求變成「先導航到機場,再把空調調到 23 度,播放收藏的博客」,多數系統要麼漏執行,要麼明顯卡頓。 原因在於系統架構的限制。 主流車載語音方案,大多延續了移動互聯網時期的設計思路。語音先進入 NLU 模塊,被拆解為結構化意圖,再按領域分發:導航、車控、媒體、閒聊,各自對應獨立模塊處理。 跨域任務需要調度系統串聯完成,但模塊之間缺乏統一語境,只能靠規則拼接,一旦鏈路變長,就容易出錯。 這就使得,多輪對話難以跨域延續,所謂「長期記憶」也多停留在用户畫像層。 **要改變這點,底層架構得徹底顛覆。** 這也是為什麼,火山引擎的方法論是「AI 大腦」,相當於用更原生的 Agentic AI 方式,構建汽車 AI。 在這種新的系統組織方式上,原有的分域調度被收斂進一個統一中樞,語音、視覺、位置和車輛狀態等信息,被集中到同一模型中完成融合推理,由目標驅動引擎、對話推理引擎、學習成長引擎三大引擎推動。 效果如何? 在面向媒體開放的工程車體驗中,能清楚看到,豆包座艙助手跳出了點單、導航、對話的傳統座艙評價體系,構建出新的能力標尺——**控制整車。** 整車不單指車控,還包括導航、智駕、車載娛樂等原生車內場景,所以,座艙真的可以「辦事」了。 **第一層能力是長程任務與推理。** 類似「下班先接孩子,順路加電,再去超市,回家路上放輕音樂,下車前提醒我帶走車上的東西。」這類多步驟、跨場景的任務可以完整執行。 這種能力恰恰反映出 AI 的思考邏輯更加深刻。其它座艙思路是響應動作,但豆包座艙助手會理解意圖,即思考用户為什麼提出這一問題,當下車內環境是什麼,再去決定如何處理。 所以同樣是哄娃,傳統座艙往往只是播放兒歌。豆包座艙助手會根據情緒狀態,組合不同方式,比如音樂、動畫和故事,形成一套更完整的安撫方案。 **第二層能力是艙駕融合。** 豆包座艙助手可以用「嘴」開車,比如一句「把車開到前面那個穿藍衣服的外賣小哥旁邊。」,系統可以自主泊車。具體而言,它完成了三件事:識別目標、理解語義、轉化為駕駛動作。 類似的能力,在特斯拉 Grok 中也有體現,通過自然語言參與導航決策,更像一個「副駕」。 只不過,豆包大模型這一「副駕」不僅知道用户想怎麼開,還知道該如何正確開。它會結合導航信息、路況信息影響具體路徑決策,比如凌晨夜間市區行駛時,為規避高架封路開錯,會主動提醒用户開啓導航,同步前方路況信息。 而再往下挖一層,豆包座艙助手「辦事」聰明的能力,是被足夠自然的交互支撐起來的。 用兩個詞概括,一是鮮活,二是普適。 **鮮活,指的是交互接近真實對話。**支持多人發言、隨時打斷、臨時補充。語音和反饋是同步進行的,而不是一問一答的等待機制。 **而普適則是降低使用門檻。**沒有固定指令規則,説方言也能識別,上手成本接近於「直接開口」。 另外,由於豆包座艙助手可以多模態感知,具備更敏鋭、更穩定、更安全的視覺理解能力,但又嚴格保障用户隱私數據本地處理,隱私不出車。 值得注意的是,這一套體系,並沒有把重點放在「生態數量」上。 一方面,簡單堆疊應用,很難解決核心問題。 另一方面,生態本身並不是壁壘。無論是字節系內容,還是第三方服務,火山引擎都可以接入。 豆包座艙助手的重點其實是回到一件更基礎的事情上:**車能不能幫你把事高效辦好。** 從這個角度着眼,AI 大腦的意義其實更清晰了,一個可以統一理解、決策的系統,才是座艙做到「活人感」的核心基礎。 而當語音交互不再圍繞指令設計,而是圍繞目標展開,智能座艙才具備進一步演進的基礎。 **03、火山引擎,後發者佔領 AI 座艙高地** 相比還停留在 Demo 展示階段的方案,火山引擎更早把重心放在落地。 目前,搭載豆包大模型的智能汽車已經超過 700 萬台,覆蓋 50 多個品牌、145 個車型,日均座艙交互次數超過 3000 萬,位居行業一位。 座艙能力是否成立,關鍵是用户是否願意持續使用,顯然,火山引擎這點立住了。 合作名單也提供了一個側面。從特斯拉、奔馳這樣的頭部品牌,到國內主流車企,豆包大模型已經進入不同層級的產品體系,部分合作甚至深化到汽車雲層面。 這種趨勢在車展上更加直觀。**「豆包含量」將成為高頻詞彙。** 這屆車展上,梅賽德斯 - 奔馳純電 GLC、上汽奧迪 E7X、上汽大眾 ID. ERA 9X、奇瑞星途 EX7、一汽紅旗 HS6 PHEV、別克至境 E7、榮威新序列 “家越” 等新車型,都搭載了豆包大模型。 背後對應的是兩條能力線在同時推進。 **一條是座艙本身的智能化能力;另一條,則是圍繞座艙展開的服務接入能力。** 火山引擎這次給出的方案,也對應這兩條路徑。 一層是「豆包座艙助手」,作為應用級產品直接輸出。車企可以獲得一套完整的交互能力和體驗體系,縮短從集成到落地的週期。 另一層是「AI 座艙套件」,輸出的是大模型底層能力。 包括模型推理、工具調用、多模態感知等模塊,車企可以根據自身需求進行定製開發。 兩套方案對應的是行業內不同的技術策略。 一部分廠商希望快速獲得成熟體驗,降低開發成本;另一部分則更關注長期能力積累,希望保留更多自研空間。**火山引擎相當於扮演了一個能力平台角色。** 回看火山引擎在 AI 座艙的佈局路徑,可以看到一個相對清晰的節奏。雖然是後來者,但每一步都具備前瞻性。 從 2023 年入局開始,沒有跟風優先做界面或交互包裝,而是先處理底層能力。 **第一步,是讓模型具備工具調用能力。** 車內上千個功能接口,需要被理解並正確調度。 **第二步,是引入對環境和車輛狀態的感知。** 車速、位置、電量、駕駛模式等信息,被納入決策體系。 **第三步,再是將這些能力整合為統一模型,形成「AI 大腦」。** 重構底層架構,是豆包座艙助手實現能力「湧現」的關鍵。 從行業視角看,智能座艙正在從「配置項」轉向「決策項」。系統是否理解用户、能否在關鍵時刻做出判斷,開始直接影響體驗。 這也意味着,座艙的終局很難是一個「應用商店」。應用分發依賴用户主動選擇,而車內場景更需要減少操作。 更合理的形態,是一個**具備長期記憶、持續學習能力,並能主動提供服務的系統。它更聰明,也更接近「人」。** 當座艙走到這一步,對車企的意義也會改變。從附加賣點,成為建立差異化的關鍵區域,甚至直接影響用户的購車決策。 因此,一個像「豆包座艙助手」一樣,能夠理解用户、持續提供幫助的系統,其價值不止於體驗提升,大概率會成為用户購車的關鍵理由。 $中科創達(300496.SZ) $四維圖新(002405.SZ) $上汽集團(600104.SH) ### 相關股票 - [DPSK.NA](https://longbridge.com/zh-HK/quote/DPSK.NA.md) - [002405.CN](https://longbridge.com/zh-HK/quote/002405.CN.md) - [600104.CN](https://longbridge.com/zh-HK/quote/600104.CN.md) - [300496.CN](https://longbridge.com/zh-HK/quote/300496.CN.md)