汽车之心
2026.04.25 14:14

站在物理 AI 分水嶺,商湯絕影 “一劍定乾坤”

portai
我是 LongbridgeAI,我可以總結文章信息。

今年新能源汽車滲透率持續攀升,行業由政策驅動全面轉向市場驅動,智能化競爭進入深水區。

理想 MindVLA-o1 已實現自然語言理解、自主推理與複雜泊車,華為、小鵬、蔚來等也加速推進艙駕一體,智駕與座艙邊界正系統性消融。

這一切共同印證:物理 AI 時代正加速到來。

而這一趨勢在產業一線集中呈現。

2026 北京車展,整車與核心技術供應商第一次在物理空間融在一起。這種融合在傳遞一個強烈信號:

智能駕駛的定義權,正從幕後走向台前。誰能定義「整車智能」,誰就掌握下一輪競爭的入場券。

「整車智能」並不是一個終點的概念,只是一道入口命題。當 AI 完成「感知—決策—物理執行」的完整閉環,AI 才算真正從「軟件智能」升維到「物理智能」。

換言之,物理 AI 的可信落地是定義整車智能的核心標尺。

然而,物理 AI 必須直面現實世界,由於真實物理世界的不確定性、極端場景的不可預測性,AI 難以做到穩定、可解釋、可驗證的可信決策。

從算法可行到上車可信,看似咫尺之遙,卻是最難跨越的「最後 500 米」。

那麼這道橫亙在量產與安全之間的關卡,真正的瓶頸究竟是什麼?

01、物理 AI,困於可信

回看自動駕駛的進化路徑,答案一目瞭然。

第一階段是規則時代

靠人工寫邏輯、調參數、補場景,遇到新情況就得重新開發,迭代慢如蝸牛。

第二階段是端到端時代

從視覺信號直接輸出駕駛動作,靠模仿學習學會「像人一樣開車」。但它只解決了「能不能開」,沒解決「敢不敢信」。AI 的決策變成黑盒:為什麼剎、為什麼避、為什麼繞,乘客一無所知,不信任感無意間被放大。

商湯絕影曾有一個很形象的比喻:「端到端和傳統技術範式的區別,就是人腦通用性之於動物的區別。」

但人之所以為人,不只是會動作,更會解釋、會溝通、會讓人安心。「我為什麼剎車」、「前面發生了什麼」、「接下來要怎麼做」——這些,才是用户真正在意的東西。

這正是「可信」問題的癥結所在。商湯絕影曾判斷:「端到端是智能駕駛的 ChatGPT 時刻。」既然是 ChatGPT 時刻,為什麼用户還不信任?

原因是因為端到端解決了能力,但沒有解決可解釋性。智駕高端局的決戰,戰場在雲端,但入場券是「可信」。

這背後,藏着一整條清晰的技術脈絡。

第一步:模仿學習。

用海量人類駕駛數據訓練,讓 AI 學會「看到什麼,就做什麼」,這是特斯拉 FSD V12 走通的路徑。

第二步:世界模型。

不只模仿,還能「想象」,在虛擬世界裏預演各種可能,提前推演決策後果。這正是 2024 年商湯絕影「開悟」世界模型的核心邏輯。

第三步:強化學習。

讓模型與世界模型持續交互、試錯、反饋、迭代,最終超越普通人類駕駛水平。這便是 2025 年商湯絕影 R-UniAD 的技術路線。

因此,端到端的瓶頸,不在車端,而在雲端;不在數據量,而在數據質量;不在能不能開,而在敢不敢信

於是今年,行業出現了一次關鍵轉向:從功能可用,走向體驗可信。

2026 年,大模型行業正跨過關鍵拐點:從 AGI L2 推理階段,加速邁向 AGI L3 自主執行階段。當智駕開始「會思考」,則是重塑智能座艙的競爭邏輯。

過去的座艙是「人找功能」:你説導航,它才導航;你不説,它沉默等待。

更進一步的智能應該是「車懂人心」:知道你在開車、知道快下班、知道你常去的地點,主動提醒、主動規劃、主動服務。這是從工具到智能體的本質跨越。

然而這一步,被一道行業鐵律死死卡住:端側大模型上車的「不可能三角」。

「能力強:要能做智能體、多步推理、複雜任務閉環」;

「跑得動:要在車規 Orin/Xavier 芯片上低延遲、低功耗運行」;

「用得起:主流場景免雲端 Token 計費、端側閉環降本、可大規模量產」。

行業落地過程中,三類主流方案都需要做出權衡與取捨。

02、商湯絕影如何破局「物理 AI」可信度?

純雲端方案能力強,卻受制於網絡穩定性與長期成本;輕量化端側小模型運行穩定,卻難以支撐高階智能體任務;常規車雲協同方案則面臨調度複雜、體驗割裂的困境。

三類路線各有取捨,但無一能同時滿足強能力、低功耗、低成本的核心訴求。

當行業普遍深陷車載大模型的「不可能三角」,在強能力、低功耗、低成本之間反覆取捨時,商湯絕影選擇了差異化的技術路徑。

跳出非此即彼的取捨邏輯,通過底層架構革新,探索一套更適配車載量產環境的端側大模型解決方案。

2026 北京車展期間,商湯絕影正式推出 SageBox(千機智盒),構建了「Sage 端側模型、Sage OS(千機系統)、New Member 原生智能體」三層技術架構。

這款產品,讓高階智能體能力在車端有限硬件條件下跑通起來了。

MoE 架構、總參數 32B、激活參數僅 3B,在全球 Agent 權威評測基準 PinchBench 上以 94% 任務完成率 超越 Claude、GPT-5.4、Gemini,所需激活算力僅為同級端側旗艦的 1/14,顯存佔用約 1/31。

這是物理 AI 落地的基礎條件:模型必須真正住在車裏,才能在沒有網絡、沒有云端的極端場景下照常工作。

能力緯度測評

商湯絕影認為:「打破三角的關鍵,不是『取捨』,而是『解耦』——讓能力與成本各歸其位,互不妥協。」

支撐這一切的,是兩項自研技術:

SCOUT 框架讓複雜能力注入時 GPU 消耗節省約 60%;ERL 可擦除強化學習(已被 ICLR 2026 收錄)在多步推理中自動識別並抹除錯誤步驟,裝車後複雜任務完成率提升 20%。

三個設計,分別對應不可能三角的三個頂點:MoE 解決能力與負載的矛盾,SCOUT 解決訓練成本的問題,ERL 解決推理穩定性的挑戰。

於是,當你説「預熱車內、導航回家、切換輕鬆音樂」,Sage 無需逐句確認,0.5 秒內聯動空調、導航、音樂三套系統;檢測到後排有兒童時,主動觸發兒童模式,不等喚醒。

可信的第一步,是 AI 真的在場——不依賴雲,不怕斷網,始終穩定。Sage 的價值,不在於堆砌技術,而在於用一套體系化的解耦思路,緩和了這道長期存在的行業難題。

小模型獲得最高成績

智駕的信任危機,比座艙更深。

它不是「聽不懂指令」,而是「你不知道它為什麼這麼開」。

傳統規則驅動的智駕,遇到長尾場景就僵;模仿學習復刻的智駕,遇到沒見過的情況就迷;二段式端到端,信息在模塊邊界被壓縮,決策鏈條不透明,系統「猶豫」甚至突然反轉——這些,都在消耗用户對智駕的信任。

商湯絕影今年升級的 R-UniAD 2.0 生成式智駕方案,更進一步打破了傳統端到端架構的數據瓶頸,新增多模態交互能力,可精準響應駕駛員自然語言指令,實現決策可解釋與艙駕場景全覆蓋——系統更透明,體驗更連貫。

可信的第二步,是 AI 的決策有據可循——不是黑盒,是可被理解的判斷過程,可被驗證的量產結果。

作為統一智能底座,該方案可無縫適配 L2 至 L4,並已在北京、武漢等城市泛化測試中穩居行業頭部,與東風汽車的量產合作,標誌着智駕從模仿學習正式走向自主進化。

前兩層可信解決的是——艙內大腦穩不穩、駕駛決策靠不靠譜。但物理 AI 真正的可信,必須是系統級的。

如果艙和駕各自為戰,用户永遠要在兩套邏輯、兩套體驗、兩種「信任預算」之間切換。這正是當前大多數智能車的真實處境:

座艙是一個產品,智駕是另一個產品,整車是兩者的物理拼接。

商湯絕影選擇打通這堵牆。

SenseAuto Go 依託生成式智駕 R-UniAD 2.0、New Member 2.0 及 SageBox 千機智盒三大核心技術支撐,構建艙駕一體超級智能體,不僅可實現 L4 級自動駕駛的點到點高效接駁,更將智駕的安全可靠與智艙的主動交互。

「真正的 AI 汽車,是一個真正懂你、愛你、守護你的家庭新成員。」

在如今的車企智能化賽道上,堆參數容易,建信任難。

商湯絕影走的路,是物理 AI 可信落地最難走、也最有價值的那條:端側裝得下的大腦、量產經得起的決策、整車撐得住的守護。

艙駕一體,不是功能的疊加,而是可信度的統一。

03、整車智能體,執棋破局

2026 年的智能座艙,正站在一個清晰的範式切換路口。

行業不再是小步迭代,而是從功能堆砌走向智能體驅動,而每一次範式轉移,留給玩家的窗口期,都比想象中更短。

更關鍵的變化在於:智駕與座艙的技術路線正在快速收斂。過去兩者是兩套獨立系統;而多模態大模型的出現,讓它們擁有了統一底座——同一個模型,既可處理駕駛感知,也可承接座艙交互。

這意味着,車企的選擇邏輯正在改變:

從「智駕選一家、座艙選一家」,轉向「尋找能打通全域的一體化方案」。一旦深度綁定,切換成本將急劇升高。

而在這場窗口期競賽裏,端側能力是真正的差異化變量。

雲端大模型更像「公共資源」,任何廠商都可接入,差異僅停留在提示詞與場景層,容易被複制。但把大模型高效跑在車規芯片上,做到低延遲、高穩定、強推理,是長期工程化積累的結果,難以短期追趕。

這也是為什麼,商湯絕影的佈局並非從單一維度切入,而是沿着一條清晰且連續的路徑展開。

從 2022 年 UniAD 到 2025 年「開悟」世界模型,再到今年 R-UniAD2.0 與 Sage 相繼落地,這條路徑清晰且連續:從感知到認知,從駕駛到座艙,從單點突破到全域融合,最終指向的,是同一個目標:艙駕一體全場景智能體。

這個「一體」,不是用中間件簡單連接兩套系統,而是認知層面的真正融合。

  • 模型架構:MoE 混合專家、激活策略、量化與壓縮技術
  • 後訓練體系:SCOUT 分級學習、ERL 可擦除強化學習等自研算法
  • 車規落地:與芯片平台深度適配、大量實車場景驗證

三層能力疊加,構成了難以複製的壁壘。

特斯拉、小鵬、理想等頭部車企正悄然推進組織重構,試圖將 AI 能力內化,打通智駕與座艙的研發壁壘。

但對多數車企而言,從零自研艙駕一體底座的技術門檻極高,不僅需要模型能力,還需要車規適配、數據飛輪與持續的工程化投入。

商湯絕影的切入點正在於此:通過兼容主流 Agent 框架,提供開放基座,讓車企不必從零搭建技術棧,即可快速接入端側智能體能力。

這種「基座 + 生態」的模式,一方面降低了車企進入艙駕一體的門檻,另一方面也構成了商湯絕影獨特的技術護城河。

回到最初的問題:物理 AI 時代,汽車將走向何方?

答案已經清晰:不再是單點功能的軍備競賽,而是艙與駕的認知統一。

讓 AI 的每一次感知、每一次決策都穩定可驗證,讓更懂人心的座艙交互與更擬人的智駕決策,由同一個智能體底座驅動,交付到用户手中。

這是商湯絕影的全局競爭力:

從 Sage 的端側智能體底座,到生成式智駕的量產落地,再到艙駕一體全場景智能體的統一願景——不只是在每個賽點領先一步,而是在每一個賽點之間,鋪設好了相互貫通的技術連貫性。

下半場的窗口期不會停留。

未來兩三年,端到端與艙駕融合路線將趨於穩定,後來者不僅面臨技術追趕難題,更要面對組織慣性、數據飛輪、生態綁定的三重路徑依賴。

特斯拉、小鵬、理想通過組織重構內化 AI 能力,是自上而下的戰略先手;商湯絕影以開放基座賦能車企艙駕一體,則是自下而上的技術落子。

兩條路殊途同歸,都指向同一個方向——誰先建立起艙駕一體的端側智能體底座與生態護城河,誰就率先定義整車智能的下一個時代。

$商湯-WR(80020.HK) $商湯-W(00020.HK)

本文版權歸屬原作者/機構所有。

當前內容僅代表作者觀點,與本平台立場無關。內容僅供投資者參考,亦不構成任何投資建議。如對本平台提供的內容服務有任何疑問或建議,請聯絡我們。