--- title: "站在物理 AI 分水嶺,商湯絕影 “一劍定乾坤”" type: "Topics" locale: "zh-HK" url: "https://longbridge.com/zh-HK/topics/40200718.md" description: "今年新能源汽車滲透率持續攀升,行業由政策驅動全面轉向市場驅動,智能化競爭進入深水區。理想 MindVLA-o1 已實現自然語言理解、自主推理與複雜泊車,華為、小鵬、蔚來等也加速推進艙駕一體,智駕與座艙邊界正系統性消融。這一切共同印證:物理 AI 時代正加速到來。而這一趨勢在產業一線集中呈現。2026 北京車展,整車與核心技術供應商第一次在物理空間融在一起..." datetime: "2026-04-25T14:14:30.000Z" locales: - [en](https://longbridge.com/en/topics/40200718.md) - [zh-CN](https://longbridge.com/zh-CN/topics/40200718.md) - [zh-HK](https://longbridge.com/zh-HK/topics/40200718.md) author: "[汽车之心](https://longbridge.com/zh-HK/profiles/3726156.md)" --- # 站在物理 AI 分水嶺,商湯絕影 “一劍定乾坤” 今年新能源汽車滲透率持續攀升,行業由政策驅動全面轉向市場驅動,智能化競爭進入深水區。 理想 MindVLA-o1 已實現自然語言理解、自主推理與複雜泊車,華為、小鵬、蔚來等也加速推進艙駕一體,智駕與座艙邊界正系統性消融。 這一切共同印證:**物理 AI 時代正加速到來。** 而這一趨勢在產業一線集中呈現。 2026 北京車展,整車與核心技術供應商第一次在物理空間融在一起。這種融合在傳遞一個強烈信號: **智能駕駛的定義權,正從幕後走向台前。誰能定義「整車智能」,誰就掌握下一輪競爭的入場券。** 「整車智能」並不是一個終點的概念,只是一道入口命題。當 AI 完成「感知—決策—物理執行」的完整閉環,AI 才算真正從「軟件智能」升維到「物理智能」。 換言之,物理 AI 的可信落地是定義整車智能的核心標尺。 然而,物理 AI 必須直面現實世界,由於真實物理世界的不確定性、極端場景的不可預測性,AI 難以做到穩定、可解釋、可驗證的可信決策。 從算法可行到上車可信,看似咫尺之遙,卻是**最難跨越的「最後 500 米」。** 那麼這道橫亙在量產與安全之間的關卡,真正的瓶頸究竟是什麼? **01、物理 AI,困於可信** 回看自動駕駛的進化路徑,答案一目瞭然。 第一階段是**規則時代**。 靠人工寫邏輯、調參數、補場景,遇到新情況就得重新開發,迭代慢如蝸牛。 第二階段是**端到端時代**。 從視覺信號直接輸出駕駛動作,靠模仿學習學會「像人一樣開車」。但它只解決了「能不能開」,沒解決「敢不敢信」。AI 的決策變成黑盒:為什麼剎、為什麼避、為什麼繞,乘客一無所知,不信任感無意間被放大。 商湯絕影曾有一個很形象的比喻:**「端到端和傳統技術範式的區別,就是人腦通用性之於動物的區別。」** 但人之所以為人,不只是會動作,更會解釋、會溝通、會讓人安心。「我為什麼剎車」、「前面發生了什麼」、「接下來要怎麼做」——這些,才是用户真正在意的東西。 這正是「可信」問題的癥結所在。商湯絕影曾判斷:「端到端是智能駕駛的 ChatGPT 時刻。」既然是 ChatGPT 時刻,為什麼用户還不信任? 原因是因為端到端解決了能力,但沒有解決可解釋性。智駕高端局的決戰,戰場在雲端,但入場券是「可信」。 這背後,藏着一整條清晰的技術脈絡。 第一步:**模仿學習。** 用海量人類駕駛數據訓練,讓 AI 學會「看到什麼,就做什麼」,這是特斯拉 FSD V12 走通的路徑。 第二步:**世界模型。** 不只模仿,還能「想象」,在虛擬世界裏預演各種可能,提前推演決策後果。這正是 2024 年商湯絕影「開悟」世界模型的核心邏輯。 第三步:**強化學習。** 讓模型與世界模型持續交互、試錯、反饋、迭代,最終超越普通人類駕駛水平。這便是 2025 年商湯絕影 R-UniAD 的技術路線。 因此,端到端的瓶頸,不在車端,而在**雲端**;不在數據量,而在**數據質量**;不在能不能開,而在**敢不敢信**。 於是今年,行業出現了一次關鍵轉向:**從功能可用,走向體驗可信。** 2026 年,大模型行業正跨過關鍵拐點:從 AGI L2 推理階段,加速邁向 AGI L3 自主執行階段。當智駕開始「會思考」,則是重塑智能座艙的競爭邏輯。 過去的座艙是「人找功能」:你説導航,它才導航;你不説,它沉默等待。 更進一步的智能應該是「車懂人心」:知道你在開車、知道快下班、知道你常去的地點,主動提醒、主動規劃、主動服務。這是從工具到智能體的本質跨越。 然而這一步,被一道行業鐵律死死卡住:端側大模型上車的「不可能三角」。 「能力強:要能做智能體、多步推理、複雜任務閉環」; 「跑得動:要在車規 Orin/Xavier 芯片上低延遲、低功耗運行」; 「用得起:主流場景免雲端 Token 計費、端側閉環降本、可大規模量產」。 行業落地過程中,三類主流方案都需要做出權衡與取捨。 **02、商湯絕影如何破局「物理 AI」可信度?** 純雲端方案能力強,卻受制於網絡穩定性與長期成本;輕量化端側小模型運行穩定,卻難以支撐高階智能體任務;常規車雲協同方案則面臨調度複雜、體驗割裂的困境。 三類路線各有取捨,**但無一能同時滿足強能力、低功耗、低成本的核心訴求。** 當行業普遍深陷車載大模型的「不可能三角」,在強能力、低功耗、低成本之間反覆取捨時,商湯絕影選擇了差異化的技術路徑。 跳出非此即彼的取捨邏輯,通過底層架構革新,探索一套更適配車載量產環境的端側大模型解決方案。 2026 北京車展期間,商湯絕影正式推出 SageBox(千機智盒),構建了**「Sage 端側模型、Sage OS**(千機系統)**、New Member 原生智能體」**三層技術架構。 這款產品,讓高階智能體能力在車端有限硬件條件下跑通起來了。 MoE 架構、總參數 32B、激活參數僅 3B,在全球 Agent 權威評測基準 PinchBench 上以 94% 任務完成率 超越 Claude、GPT-5.4、Gemini,所需激活算力僅為同級端側旗艦的 1/14,顯存佔用約 1/31。 這是物理 AI 落地的基礎條件:**模型必須真正住在車裏,才能在沒有網絡、沒有云端的極端場景下照常工作。** 能力緯度測評 商湯絕影認為:「打破三角的關鍵,不是『取捨』,而是『解耦』——讓能力與成本各歸其位,互不妥協。」 支撐這一切的,是兩項自研技術: SCOUT 框架讓複雜能力注入時 GPU 消耗節省約 60%;ERL 可擦除強化學習(已被 ICLR 2026 收錄)在多步推理中自動識別並抹除錯誤步驟,裝車後複雜任務完成率提升 20%。 三個設計,分別對應不可能三角的三個頂點:MoE 解決能力與負載的矛盾,SCOUT 解決訓練成本的問題,ERL 解決推理穩定性的挑戰。 於是,當你説「預熱車內、導航回家、切換輕鬆音樂」,Sage 無需逐句確認,0.5 秒內聯動空調、導航、音樂三套系統;檢測到後排有兒童時,主動觸發兒童模式,不等喚醒。 可信的第一步,是 AI 真的在場——不依賴雲,不怕斷網,始終穩定。Sage 的價值,不在於堆砌技術,而在於用一套體系化的解耦思路,緩和了這道長期存在的行業難題。 小模型獲得最高成績 智駕的信任危機,比座艙更深。 它不是「聽不懂指令」,而是「你不知道它為什麼這麼開」。 傳統規則驅動的智駕,遇到長尾場景就僵;模仿學習復刻的智駕,遇到沒見過的情況就迷;二段式端到端,信息在模塊邊界被壓縮,決策鏈條不透明,系統「猶豫」甚至突然反轉——這些,**都在消耗用户對智駕的信任。** 商湯絕影今年升級的 R-UniAD 2.0 生成式智駕方案,更進一步打破了傳統端到端架構的數據瓶頸,新增多模態交互能力,可精準響應駕駛員自然語言指令,實現決策可解釋與艙駕場景全覆蓋——系統更透明,體驗更連貫。 可信的第二步,是 AI 的決策有據可循——不是黑盒,是可被理解的判斷過程,可被驗證的量產結果。 作為統一智能底座,該方案可無縫適配 L2 至 L4,並已在北京、武漢等城市泛化測試中穩居行業頭部,與東風汽車的量產合作,標誌着智駕從模仿學習正式走向自主進化。 前兩層可信解決的是——**艙內大腦穩不穩、駕駛決策靠不靠譜。**但物理 AI 真正的可信,必須是系統級的。 如果艙和駕各自為戰,用户永遠要在兩套邏輯、兩套體驗、兩種「信任預算」之間切換。這正是當前大多數智能車的真實處境: 座艙是一個產品,智駕是另一個產品,整車是兩者的物理拼接。 商湯絕影選擇打通這堵牆。 SenseAuto Go 依託生成式智駕 R-UniAD 2.0、New Member 2.0 及 SageBox 千機智盒三大核心技術支撐,構建艙駕一體超級智能體,不僅可實現 L4 級自動駕駛的點到點高效接駁,更將智駕的安全可靠與智艙的主動交互。 「真正的 AI 汽車,是一個真正懂你、愛你、守護你的家庭新成員。」 在如今的車企智能化賽道上,堆參數容易,建信任難。 商湯絕影走的路,是物理 AI 可信落地最難走、也最有價值的那條:端側裝得下的大腦、量產經得起的決策、整車撐得住的守護。 艙駕一體,不是功能的疊加,而是可信度的統一。 **03、整車智能體,執棋破局** 2026 年的智能座艙,正站在一個清晰的範式切換路口。 行業不再是小步迭代,而是從功能堆砌走向智能體驅動,而每一次範式轉移,留給玩家的窗口期,都比想象中更短。 更關鍵的變化在於:**智駕與座艙的技術路線正在快速收斂。**過去兩者是兩套獨立系統;而多模態大模型的出現,讓它們擁有了統一底座——同一個模型,既可處理駕駛感知,也可承接座艙交互。 這意味着,車企的選擇邏輯正在改變: 從「智駕選一家、座艙選一家」,轉向「尋找能打通全域的一體化方案」。一旦深度綁定,切換成本將急劇升高。 而在這場窗口期競賽裏,端側能力是真正的差異化變量。 雲端大模型更像「公共資源」,任何廠商都可接入,差異僅停留在提示詞與場景層,容易被複制。但把大模型高效跑在車規芯片上,做到低延遲、高穩定、強推理,是長期工程化積累的結果,難以短期追趕。 這也是為什麼,商湯絕影的佈局並非從單一維度切入,而是沿着一條清晰且連續的路徑展開。 從 2022 年 UniAD 到 2025 年「開悟」世界模型,再到今年 R-UniAD2.0 與 Sage 相繼落地,這條路徑清晰且連續:從感知到認知,從駕駛到座艙,從單點突破到全域融合,最終指向的,是同一個目標:艙駕一體全場景智能體。 這個「一體」,不是用中間件簡單連接兩套系統,而是認知層面的真正融合。 - 模型架構:MoE 混合專家、激活策略、量化與壓縮技術 - 後訓練體系:SCOUT 分級學習、ERL 可擦除強化學習等自研算法 - 車規落地:與芯片平台深度適配、大量實車場景驗證 三層能力疊加,構成了難以複製的壁壘。 特斯拉、小鵬、理想等頭部車企正悄然推進組織重構,試圖將 AI 能力內化,打通智駕與座艙的研發壁壘。 但對多數車企而言,從零自研艙駕一體底座的技術門檻極高,不僅需要模型能力,還需要車規適配、數據飛輪與持續的工程化投入。 商湯絕影的切入點正在於此:通過兼容主流 Agent 框架,提供開放基座,讓車企不必從零搭建技術棧,即可快速接入端側智能體能力。 這種「基座 + 生態」的模式,一方面降低了車企進入艙駕一體的門檻,另一方面也構成了商湯絕影獨特的技術護城河。 回到最初的問題:物理 AI 時代,汽車將走向何方? 答案已經清晰:**不再是單點功能的軍備競賽,而是艙與駕的認知統一。** 讓 AI 的每一次感知、每一次決策都穩定可驗證,讓更懂人心的座艙交互與更擬人的智駕決策,由同一個智能體底座驅動,交付到用户手中。 這是商湯絕影的全局競爭力: 從 Sage 的端側智能體底座,到生成式智駕的量產落地,再到艙駕一體全場景智能體的統一願景——不只是在每個賽點領先一步,而是在每一個賽點之間,鋪設好了相互貫通的技術連貫性。 下半場的窗口期不會停留。 未來兩三年,端到端與艙駕融合路線將趨於穩定,後來者不僅面臨技術追趕難題,更要面對組織慣性、數據飛輪、生態綁定的三重路徑依賴。 特斯拉、小鵬、理想通過組織重構內化 AI 能力,是自上而下的戰略先手;商湯絕影以開放基座賦能車企艙駕一體,則是自下而上的技術落子。 兩條路殊途同歸,都指向同一個方向——**誰先建立起艙駕一體的端側智能體底座與生態護城河,誰就率先定義整車智能的下一個時代。** $商湯-WR(80020.HK) $商湯-W(00020.HK) ### 相關股票 - [HUAWEI.NA](https://longbridge.com/zh-HK/quote/HUAWEI.NA.md) - [80020.HK](https://longbridge.com/zh-HK/quote/80020.HK.md) - [00020.HK](https://longbridge.com/zh-HK/quote/00020.HK.md)