
巨頭蜂擁而至,商湯背水一戰

當全球科技巨頭競相押注具身智能這一 AI 新風口時,中國 AI 產業的標誌性企業商湯科技也吹響了全面進軍的號角。
這家曾以計算機視覺技術聞名、位列"AI 四小龍"之首的科技企業,在經歷大模型時代的轉型陣痛後,正試圖通過"大模型 + 機器人"的戰略組合實現絕地反擊。
圖源來自 pixabay 圖庫
從密集的資本運作到頂尖人才集結,從技術路線重構到生態聯盟搭建,商湯的具身智能佈局已遠不止於簡單的業務拓展,而是一場關乎生死的轉型之戰。
風口上的戰略轉身,商湯為何 All in 具身智能?
日漸擁擠的具身智能賽道,前有螞蟻集團直接成立子公司 “螞蟻靈波科技”,後有美團密集領投它石智航、星海圖,京東連續投資千尋智能、眾擎機器人等企業。
海外戰場同樣硝煙瀰漫,谷歌 RT-2 模型、Figure AI 的 Helix 系統、英偉達的世界模型,均在爭奪物理世界交互的制高點。
作為中國 AI 產業曾經的標杆企業,商湯與曠視、雲從、依圖並稱為"AI 四小龍",憑藉領先的計算機視覺技術在安防、智慧城市等領域風光無限,2021 年登陸港股後,首日市值一度突破 1500 億港元。
然而進入大模型時代後,這批以視覺技術見長的 AI 企業集體開始遭遇發展瓶頸。商湯 2024 年財報顯示,公司全年實現營收 37.72 億元,淨虧損卻高達 43.07 億元,虧損額甚至超過營收總額。
同樣慘淡的還有云從科技,其 2024 年營收同比下滑 36.7%,淨虧損擴大至 6.96 億元;而曠視和依圖則面臨業務收縮,後者甚至關閉了多個城市的辦事處,醫療板塊幾近停擺。
尤其在大模型浪潮下,OpenAI、月之暗面、深度求索等公司憑藉語言大模型迅速崛起,而"四小龍"的技術主線仍集中在計算機視覺領域,核心收入依賴安防、交通等政府項目,佔比普遍超過 70%。
可見,商湯此次戰略轉型的背景實則是迫於生存壓力的背水一戰。
從另一角度來看,商湯的入局,也是一場蓄謀已久的 “基因延伸”。據悉,其核心團隊已初步組建完畢,部分來自其原有的智能駕駛業務,另一些則是計算機視覺專家和機器人領域資深從業者。
而這種人才流動也揭示了行業共性。自動駕駛與具身智能在環境感知、實時建模等底層技術上高度相通。畢竟 “車就是四個輪子的機器人”,而智能駕駛的算法、仿真平台在一定程度上,也可以直接遷移至機器人開發。
而且,具身智能(Embodied AI)被視為 AI 技術 “落地化” 的關鍵突破口,其核心在於通過機器人等物理實體實現"感知 - 理解 - 決策 - 執行"的閉環交互。
這一概念在 2025 年政府工作報告中作為未來產業被首次提及,隨即引發資本熱潮,僅上半年國內該領域融資就超過 200 億元,涉及 130 起融資事件,遠超 2024 年全年總和。
行業普遍預測,按照馬斯克提出的願景,未來人形機器人將成為工業主力,數量有望超越人類,預計達到 100 億台至 200 億台,形成 “不亞於手機的新終端市場”。
商湯選擇此時入局,正是希望藉助 “大模型 + 機器人” 的複合路徑,將自身在視覺識別、多模態感知和大模型訓練方面的積累轉化為新的增長引擎。
躬身入局的商湯,有自己的 “具身智能” 方程式
從 “看懂世界” 的視覺識別,到 “思考世界” 的多模態大模型,再到即將實現的 “動手改造世界” 的具身智能系統。商湯科技進軍具身智能絕非一時興起,而是基於其技術積累的漸進式躍遷。
商湯聯合創始人王曉剛帶領的團隊在智能駕駛領域研發的"絕影開悟"系統,已經能夠理解物理規律和學習交通規則,而汽車與機器人在本質上都是具身智能體,這為技術遷移提供了可能。
不僅如此,商湯在技術路線上採取了分階段演進的務實策略。2022 年 8 月,商湯推出家用下棋機器人"元蘿蔔",首個家庭消費級人工智能產品,並將視覺算法與機械手深度結合,實現了棋子識別與遮擋環境下的精準抓取,初步構建了"視覺 - 感知 - 決策"的閉環框架。
這一產品雖然功能單一,卻標誌着商湯開始嘗試突破傳統 AI 的"開環"侷限——從坐在雲端"思考"世界,到真正與物理世界互動。
2025 年 4 月,商湯發佈"日日新 SenseNova V6"多模態大模型,採用混合專家架構 (MoE),擁有 6000 億參數,實現了"長思維鏈×數理能力×推理能力×全局記憶"的綜合提升,特別強化了多模態深度推理能力。
而且,該模型被接入人形機器人"飛燕"接入使用,使其具備全景視界感知、情感交互及心理健康篩查功能,同時還可以進行更自然的思考與表達。
不僅如此,商湯即將發佈的具身智能"大腦"平台,代表着其技術整合的新高度。從目前披露的信息看,該平台旨在集成先進的感知、視覺導航及多模態交互能力,為機器人和各類智能終端提供強大賦能。
值得注意的是,商湯的轉型佈局呈現出鮮明的"三位一體"特徵。在資本層面,通過配售新股和分拆業務雙向融資;在技術層面,依託大裝置算力平台和日日新大模型構建基礎能力;在生態層面,則通過戰略合作與投資併購快速建立產業聯盟。
這種全方位推進的策略既反映了商湯轉型的決心,也暗示了其面臨的時間壓力與競爭態勢。如今,具身智能賽道已經進入第二個發展階段,各個巨頭紛紛入場。商湯必須抓住這一波機器人浪潮的紅利,否則可能錯失逆風翻盤的機會。
巨頭雲集的具身智能,商湯勝算幾何?
目前來看,具身智能賽道雖然前景廣闊,但已然成為科技巨頭與創業公司同場競技的殘酷紅海。商湯的入局面臨着來自國內外多維度競爭者的挑戰,這些對手在技術路線、資本實力和生態構建方面各有所長。
全球範圍內,OpenAI 與機器人公司 Figure AI 合作開發通用機器人,谷歌推出具身智能 RT-2 模型,英偉達則聚焦世界模型和仿真技術。
國內市場中,華為於 2025 年 6 月發佈包含 “大腦” 的 CloudRobo 具身智能平台;字節跳動 Seed 團隊在 7 月 22 日推出通用機器人模型 GR-3;智源研究院則更早發佈了跨本體具身大小腦協作框架 RoboOS 與開源具身大腦 RoboBrain。
宇樹科技 UnitreeR1(圖源來自財聯社)
與此同時,互聯網巨頭也紛紛加碼。京東領投三家機器人企業;美團連續主導了多個機器人相關的項目融資等等。
相較之下,商湯的核心優勢在於計算機視覺領域的多年積累、多模態大模型的先發佈局以及強大的算力基礎設施。視覺信息占人類感知的 80% 以上,而商湯始終活躍在機器視覺技術前沿,在圖像識別、視頻分析和環境理解方面具有深厚技術儲備。
此外,商湯"日日新"大模型系列在多模態融合方面國內領先,V6 版本已實現最長 64K 思維鏈、10 分鐘長視頻理解及深度推理等能力,這為具身智能的認知決策提供了堅實基礎。
而且,23,000PetaFlops 的算力規模則使商湯能夠支持大規模仿真訓練和複雜模型迭代,這一基礎設施優勢在短期內難以被超越。
劣勢則在於硬件經驗缺乏、現金流壓力和虧損困局。與特斯拉、華為等擁有成熟硬件供應鏈的企業相比,商湯在機器人本體設計、運動控制和硬件集成方面幾乎從零開始。
雖然通過與傅利葉、松應等企業合作可以部分彌補這一短板,但核心硬件能力的培育仍需要長期投入。在具身智能這一需要長期投入的領域,如何平衡研發投入與盈利預期將成為商湯的重大考驗。
而技術路線的不確定性也是商湯不得不面對的壓力。當前具身智能領域尚未形成統一的技術標準,VLA 模型、"大小腦"架構和世界模型三種路線並行發展,各有優劣。
此外,具身智能的 Scaling Law(規模法則)與語言模型有所不同,隨着參數增加和數據量擴大,系統性能提升的邊際成本可能更高。商湯需要精準把握技術演進方向,避免資源錯配。
結語
商湯的具身智能佈局,本質是將其計算機視覺霸權從 “看懂世界” 向 “改造世界” 的終極躍遷。
面對 AI 四小龍的集體困境——大模型時代的技術脱節、政府項目依賴,商湯選擇以 “大模型 + 機器人” 組合發起生死突圍。而此役成敗,不僅關乎企業存亡,更將重塑中國在全球具身智能競賽中的位勢。
作者:土耳其熱氣球
來源:港股研究社
本文版權歸屬原作者/機構所有。
當前內容僅代表作者觀點,與本平台立場無關。內容僅供投資者參考,亦不構成任何投資建議。如對本平台提供的內容服務有任何疑問或建議,請聯絡我們。


