---
title: "站在物理 AI 分水嶺，商湯絕影 “一劍定乾坤”"
type: "Topics"
locale: "zh-HK"
url: "https://longbridge.com/zh-HK/topics/40200718.md"
description: "今年新能源汽車滲透率持續攀升，行業由政策驅動全面轉向市場驅動，智能化競爭進入深水區。理想 MindVLA-o1 已實現自然語言理解、自主推理與複雜泊車，華為、小鵬、蔚來等也加速推進艙駕一體，智駕與座艙邊界正系統性消融。這一切共同印證：物理 AI 時代正加速到來。而這一趨勢在產業一線集中呈現。2026 北京車展，整車與核心技術供應商第一次在物理空間融在一起..."
datetime: "2026-04-25T14:14:30.000Z"
locales:
  - [en](https://longbridge.com/en/topics/40200718.md)
  - [zh-CN](https://longbridge.com/zh-CN/topics/40200718.md)
  - [zh-HK](https://longbridge.com/zh-HK/topics/40200718.md)
author: "[汽车之心](https://longbridge.com/zh-HK/profiles/3726156.md)"
---

# 站在物理 AI 分水嶺，商湯絕影 “一劍定乾坤”

今年新能源汽車滲透率持續攀升，行業由政策驅動全面轉向市場驅動，智能化競爭進入深水區。

理想 MindVLA-o1 已實現自然語言理解、自主推理與複雜泊車，華為、小鵬、蔚來等也加速推進艙駕一體，智駕與座艙邊界正系統性消融。

這一切共同印證：**物理 AI 時代正加速到來。**

而這一趨勢在產業一線集中呈現。

2026 北京車展，整車與核心技術供應商第一次在物理空間融在一起。這種融合在傳遞一個強烈信號：

**智能駕駛的定義權，正從幕後走向台前。誰能定義「整車智能」，誰就掌握下一輪競爭的入場券。**

「整車智能」並不是一個終點的概念，只是一道入口命題。當 AI 完成「感知—決策—物理執行」的完整閉環，AI 才算真正從「軟件智能」升維到「物理智能」。

換言之，物理 AI 的可信落地是定義整車智能的核心標尺。

然而，物理 AI 必須直面現實世界，由於真實物理世界的不確定性、極端場景的不可預測性，AI 難以做到穩定、可解釋、可驗證的可信決策。

從算法可行到上車可信，看似咫尺之遙，卻是**最難跨越的「最後 500 米」。**

那麼這道橫亙在量產與安全之間的關卡，真正的瓶頸究竟是什麼？

**01、物理 AI，困於可信**

回看自動駕駛的進化路徑，答案一目瞭然。

第一階段是**規則時代**。

靠人工寫邏輯、調參數、補場景，遇到新情況就得重新開發，迭代慢如蝸牛。

第二階段是**端到端時代**。

從視覺信號直接輸出駕駛動作，靠模仿學習學會「像人一樣開車」。但它只解決了「能不能開」，沒解決「敢不敢信」。AI 的決策變成黑盒：為什麼剎、為什麼避、為什麼繞，乘客一無所知，不信任感無意間被放大。

商湯絕影曾有一個很形象的比喻：**「端到端和傳統技術範式的區別，就是人腦通用性之於動物的區別。」**

但人之所以為人，不只是會動作，更會解釋、會溝通、會讓人安心。「我為什麼剎車」、「前面發生了什麼」、「接下來要怎麼做」——這些，才是用户真正在意的東西。

這正是「可信」問題的癥結所在。商湯絕影曾判斷：「端到端是智能駕駛的 ChatGPT 時刻。」既然是 ChatGPT 時刻，為什麼用户還不信任？

原因是因為端到端解決了能力，但沒有解決可解釋性。智駕高端局的決戰，戰場在雲端，但入場券是「可信」。

這背後，藏着一整條清晰的技術脈絡。

第一步：**模仿學習。**

用海量人類駕駛數據訓練，讓 AI 學會「看到什麼，就做什麼」，這是特斯拉 FSD V12 走通的路徑。

第二步：**世界模型。**

不只模仿，還能「想象」，在虛擬世界裏預演各種可能，提前推演決策後果。這正是 2024 年商湯絕影「開悟」世界模型的核心邏輯。

第三步：**強化學習。**

讓模型與世界模型持續交互、試錯、反饋、迭代，最終超越普通人類駕駛水平。這便是 2025 年商湯絕影 R-UniAD 的技術路線。

因此，端到端的瓶頸，不在車端，而在**雲端**；不在數據量，而在**數據質量**；不在能不能開，而在**敢不敢信**。

於是今年，行業出現了一次關鍵轉向：**從功能可用，走向體驗可信。**

2026 年，大模型行業正跨過關鍵拐點：從 AGI L2 推理階段，加速邁向 AGI L3 自主執行階段。當智駕開始「會思考」，則是重塑智能座艙的競爭邏輯。

過去的座艙是「人找功能」：你説導航，它才導航；你不説，它沉默等待。

更進一步的智能應該是「車懂人心」：知道你在開車、知道快下班、知道你常去的地點，主動提醒、主動規劃、主動服務。這是從工具到智能體的本質跨越。

然而這一步，被一道行業鐵律死死卡住：端側大模型上車的「不可能三角」。

「能力強：要能做智能體、多步推理、複雜任務閉環」；

「跑得動：要在車規 Orin/Xavier 芯片上低延遲、低功耗運行」；

「用得起：主流場景免雲端 Token 計費、端側閉環降本、可大規模量產」。

行業落地過程中，三類主流方案都需要做出權衡與取捨。

**02、商湯絕影如何破局「物理 AI」可信度？**

純雲端方案能力強，卻受制於網絡穩定性與長期成本；輕量化端側小模型運行穩定，卻難以支撐高階智能體任務；常規車雲協同方案則面臨調度複雜、體驗割裂的困境。

三類路線各有取捨，**但無一能同時滿足強能力、低功耗、低成本的核心訴求。**

當行業普遍深陷車載大模型的「不可能三角」，在強能力、低功耗、低成本之間反覆取捨時，商湯絕影選擇了差異化的技術路徑。

跳出非此即彼的取捨邏輯，通過底層架構革新，探索一套更適配車載量產環境的端側大模型解決方案。

2026 北京車展期間，商湯絕影正式推出 SageBox（千機智盒），構建了**「Sage 端側模型、Sage OS**（千機系統）**、New Member 原生智能體」**三層技術架構。

這款產品，讓高階智能體能力在車端有限硬件條件下跑通起來了。

MoE 架構、總參數 32B、激活參數僅 3B，在全球 Agent 權威評測基準 PinchBench 上以 94% 任務完成率 超越 Claude、GPT-5.4、Gemini，所需激活算力僅為同級端側旗艦的 1/14，顯存佔用約 1/31。

這是物理 AI 落地的基礎條件：**模型必須真正住在車裏，才能在沒有網絡、沒有云端的極端場景下照常工作。**

能力緯度測評

商湯絕影認為：「打破三角的關鍵，不是『取捨』，而是『解耦』——讓能力與成本各歸其位，互不妥協。」

支撐這一切的，是兩項自研技術：

SCOUT 框架讓複雜能力注入時 GPU 消耗節省約 60%；ERL 可擦除強化學習（已被 ICLR 2026 收錄）在多步推理中自動識別並抹除錯誤步驟，裝車後複雜任務完成率提升 20%。

三個設計，分別對應不可能三角的三個頂點：MoE 解決能力與負載的矛盾，SCOUT 解決訓練成本的問題，ERL 解決推理穩定性的挑戰。

於是，當你説「預熱車內、導航回家、切換輕鬆音樂」，Sage 無需逐句確認，0.5 秒內聯動空調、導航、音樂三套系統；檢測到後排有兒童時，主動觸發兒童模式，不等喚醒。

可信的第一步，是 AI 真的在場——不依賴雲，不怕斷網，始終穩定。Sage 的價值，不在於堆砌技術，而在於用一套體系化的解耦思路，緩和了這道長期存在的行業難題。

小模型獲得最高成績

智駕的信任危機，比座艙更深。

它不是「聽不懂指令」，而是「你不知道它為什麼這麼開」。

傳統規則驅動的智駕，遇到長尾場景就僵；模仿學習復刻的智駕，遇到沒見過的情況就迷；二段式端到端，信息在模塊邊界被壓縮，決策鏈條不透明，系統「猶豫」甚至突然反轉——這些，**都在消耗用户對智駕的信任。**

商湯絕影今年升級的 R-UniAD 2.0 生成式智駕方案，更進一步打破了傳統端到端架構的數據瓶頸，新增多模態交互能力，可精準響應駕駛員自然語言指令，實現決策可解釋與艙駕場景全覆蓋——系統更透明，體驗更連貫。

可信的第二步，是 AI 的決策有據可循——不是黑盒，是可被理解的判斷過程，可被驗證的量產結果。

作為統一智能底座，該方案可無縫適配 L2 至 L4，並已在北京、武漢等城市泛化測試中穩居行業頭部，與東風汽車的量產合作，標誌着智駕從模仿學習正式走向自主進化。

前兩層可信解決的是——**艙內大腦穩不穩、駕駛決策靠不靠譜。**但物理 AI 真正的可信，必須是系統級的。

如果艙和駕各自為戰，用户永遠要在兩套邏輯、兩套體驗、兩種「信任預算」之間切換。這正是當前大多數智能車的真實處境：

座艙是一個產品，智駕是另一個產品，整車是兩者的物理拼接。

商湯絕影選擇打通這堵牆。

SenseAuto Go 依託生成式智駕 R-UniAD 2.0、New Member 2.0 及 SageBox 千機智盒三大核心技術支撐，構建艙駕一體超級智能體，不僅可實現 L4 級自動駕駛的點到點高效接駁，更將智駕的安全可靠與智艙的主動交互。

「真正的 AI 汽車，是一個真正懂你、愛你、守護你的家庭新成員。」

在如今的車企智能化賽道上，堆參數容易，建信任難。

商湯絕影走的路，是物理 AI 可信落地最難走、也最有價值的那條：端側裝得下的大腦、量產經得起的決策、整車撐得住的守護。

艙駕一體，不是功能的疊加，而是可信度的統一。

**03、整車智能體，執棋破局**

2026 年的智能座艙，正站在一個清晰的範式切換路口。

行業不再是小步迭代，而是從功能堆砌走向智能體驅動，而每一次範式轉移，留給玩家的窗口期，都比想象中更短。

更關鍵的變化在於：**智駕與座艙的技術路線正在快速收斂。**過去兩者是兩套獨立系統；而多模態大模型的出現，讓它們擁有了統一底座——同一個模型，既可處理駕駛感知，也可承接座艙交互。

這意味着，車企的選擇邏輯正在改變：

從「智駕選一家、座艙選一家」，轉向「尋找能打通全域的一體化方案」。一旦深度綁定，切換成本將急劇升高。

而在這場窗口期競賽裏，端側能力是真正的差異化變量。

雲端大模型更像「公共資源」，任何廠商都可接入，差異僅停留在提示詞與場景層，容易被複制。但把大模型高效跑在車規芯片上，做到低延遲、高穩定、強推理，是長期工程化積累的結果，難以短期追趕。

這也是為什麼，商湯絕影的佈局並非從單一維度切入，而是沿着一條清晰且連續的路徑展開。

從 2022 年 UniAD 到 2025 年「開悟」世界模型，再到今年 R-UniAD2.0 與 Sage 相繼落地，這條路徑清晰且連續：從感知到認知，從駕駛到座艙，從單點突破到全域融合，最終指向的，是同一個目標：艙駕一體全場景智能體。

這個「一體」，不是用中間件簡單連接兩套系統，而是認知層面的真正融合。

-   模型架構：MoE 混合專家、激活策略、量化與壓縮技術
-   後訓練體系：SCOUT 分級學習、ERL 可擦除強化學習等自研算法
-   車規落地：與芯片平台深度適配、大量實車場景驗證

三層能力疊加，構成了難以複製的壁壘。

特斯拉、小鵬、理想等頭部車企正悄然推進組織重構，試圖將 AI 能力內化，打通智駕與座艙的研發壁壘。

但對多數車企而言，從零自研艙駕一體底座的技術門檻極高，不僅需要模型能力，還需要車規適配、數據飛輪與持續的工程化投入。

商湯絕影的切入點正在於此：通過兼容主流 Agent 框架，提供開放基座，讓車企不必從零搭建技術棧，即可快速接入端側智能體能力。

這種「基座 + 生態」的模式，一方面降低了車企進入艙駕一體的門檻，另一方面也構成了商湯絕影獨特的技術護城河。

回到最初的問題：物理 AI 時代，汽車將走向何方？

答案已經清晰：**不再是單點功能的軍備競賽，而是艙與駕的認知統一。**

讓 AI 的每一次感知、每一次決策都穩定可驗證，讓更懂人心的座艙交互與更擬人的智駕決策，由同一個智能體底座驅動，交付到用户手中。

這是商湯絕影的全局競爭力：

從 Sage 的端側智能體底座，到生成式智駕的量產落地，再到艙駕一體全場景智能體的統一願景——不只是在每個賽點領先一步，而是在每一個賽點之間，鋪設好了相互貫通的技術連貫性。

下半場的窗口期不會停留。

未來兩三年，端到端與艙駕融合路線將趨於穩定，後來者不僅面臨技術追趕難題，更要面對組織慣性、數據飛輪、生態綁定的三重路徑依賴。

特斯拉、小鵬、理想通過組織重構內化 AI 能力，是自上而下的戰略先手；商湯絕影以開放基座賦能車企艙駕一體，則是自下而上的技術落子。

兩條路殊途同歸，都指向同一個方向——**誰先建立起艙駕一體的端側智能體底座與生態護城河，誰就率先定義整車智能的下一個時代。**

$商湯-WR(80020.HK) $商湯-W(00020.HK)

### 相關股票

- [HUAWEI.NA](https://longbridge.com/zh-HK/quote/HUAWEI.NA.md)
- [80020.HK](https://longbridge.com/zh-HK/quote/80020.HK.md)
- [00020.HK](https://longbridge.com/zh-HK/quote/00020.HK.md)