
螞蟻下場具身智能,動了真格

當具身智能開始從 Demo 演示逐漸走向量產落地、產業應用的深水區,關於具身大腦的競爭也變得越來越激烈。
發佈新模型、乃至開源單個模型,在行業內已屢見不鮮。
但像螞蟻靈波這樣,以 “開源周” 的形式高調地連續四天、一天一發,將四款核心模型全部開源,在行業裏是獨一份的。
從看清世界,到理解任務,再到模擬世界,最後到行動落地,一套覆蓋感知、理解、模擬到執行的完整技術棧全集開源,螞蟻靈波直接攤開了一張完整模型底牌。
這套組合拳回應了行業內兩個問題:
- 如果未來每個機器人都需要一個大腦,那麼這個大腦會來自哪裏?
- 是每家機器人公司自行研發,還是會出現如智能手機時代的安卓或 iOS 一樣的共性平台?
螞蟻靈波的答案是,不僅為行業提供一個成體系的選項,也試圖成為那個共性平台本身。
在過去的 2025 年,已經見慣了各家大廠向具身智能撒錢下注,但還沒有下潛到真正的競爭之中,具身智能的主戰場目前還屬於各家初創公司。
而螞蟻靈波這種直亮底牌、自建生態的姿態,透露出一個清晰的信號:在眾多互聯網大廠中,螞蟻可能是現階段做具身智能最認真的一個。
1、螞蟻靈波,承載螞蟻集團的 AI 野心
作為螞蟻集團全資持股的子公司,從戰略層面來看,螞蟻靈波既是螞蟻集團從數字金融向實體智能延伸的重要載體,也是螞蟻集團彰顯 AI 野心、搶佔行業賽道的核心抓手。
從集團內部的實驗室研究,到一個擁有獨立建制、揹負商業化使命的實體公司。這種組織形態的改變,是螞蟻認真佈局具身智能的重要一環。
從核心成員來看,螞蟻靈波採用了很務實的商業化 + 技術研發雙核心的搭配:
- CEO 朱興:2011 年加入阿里,曾參與支付、金融服務和 O2O 等業務的技術,2023 年轉型籌建支付寶廣告事業部,完成支付寶商業化的從 0 到 1。
- 首席科學家沈宇軍:曾任螞蟻技術研究院交互智能實驗室研究員,主要研究方向為計算機視覺和深度學習。
目前,螞蟻靈波的團隊已經超過 100 人,其中碩博技術人才佔比超 9 成。
雖然成立僅一年多,螞蟻靈波整體的產品展示節奏卻很緊密,從機器人產品亮相,再到開源模型,都有很明確的技術突破和場景價值。
其 CEO 朱興表示,靈波科技選擇的是一條差異化路徑,聚焦服務和模型,專注於為機器人開發大腦。
四款模型中最先發布的是空間感知模型 LingBot-Depth,核心解決機器人看不透透明、反光材質的痛點。
通過算法優化,大幅提升了機器人對透明、反光材質的感知精度,機器人抓取透明塑料杯的成功率從 0 躍升至 50%,室內場景相對誤差降低超 70%。
二是LingBot-VLA,這是靈波開源的第一款具身智能基座模型。其核心價值在於實現了跨本體、跨任務的泛化能力,即同一個大腦可以適配不同形態的機器人,並執行多種任務。
該模型已與星海圖、松靈等多家機器人廠商完成適配。
值得一提的是,在 GM-100 機器人評測中,引入深度信息的 LingBot-VLA平均成功率達 17.3%,超越了π0.5。
在仿真基準 RoboTwin 2.0 中,面對高度隨機化干擾,其模型成功率也比π0.5 領先近 10 個百分點。
三是世界模型 LingBot-World,通過構建高保真虛擬演練環境,解決真實場景訓練成本高、風險大的問題,模型能力可對標谷歌 Genie 3。
LingBot-World 攻克了長時漂移難題,可實現 10 分鐘連續穩定生成虛擬場景,端到端交互延遲控制在 1 秒內,為機器人訓練提供了高效、低成本的解決方案。
最後亮相的是具身世界模型 LingBot-VA,這是全球首個自迴歸視頻 - 動作一體化模型,着力解決世界模型的預測如何高效轉化為行動的問題。
傳統的機器人學習範式,往往需要大量任務專用的數據,導致模型難以泛化到新的任務和場景。
而 LingBot-VA 在生成下一步世界狀態的同時,直接推演並輸出對應的動作序列,讓機器人能夠像人一樣邊推演、邊行動。
面對長時序任務、高精度任務以及柔性與關節物體操控這三大類六項高難度挑戰,模型僅需 30~50 條真機演示數據即可完成適配,且任務成功率相較π0.5 平均提升了 20%。
在本體層面,其首款人形機器人 Robbyant-R1 可在導覽中擔任導遊,在藥店分揀藥品,提供健康諮詢或執行基本的廚房任務,目前已正式投入試點應用,覆蓋餐飲、文旅、社區健康等多個民生場景。
從底層感知模型的突破,到上層世界模型的構建,再到本體場景的試水,螞蟻靈波的第一部分答卷顯得異常紮實。
然而,在靈波背後是螞蟻集團一套更為宏大的戰略性佈局。
2、螞蟻的組合拳:自研 + 投資 + 開源
如果説靈波是螞蟻佈局具身智能的前沿陣地,那麼螞蟻集團的自研 + 投資 + 開源三位一體組合拳,就是其認真下場做具身智能的底氣。
這三者環環相扣,構成了自研掌握核心技術、投資補齊硬件短板、開源擴大生態影響力的一個具備長期生態優勢的戰略閉環。
自研是根基與掌控力的體現。
早在 2015 年,螞蟻集團就成立了螞蟻技術研究院,交互智能實驗室作為六大實驗室之一,研究方向涵蓋通用 AI 算法架構、人機交互技術等方向。
2024 年,研究院明確了兩大聚焦方向,一個是數據要素核心技術,另一個是人工智能,其中具身智能與智能機器人被列為人工智能領域的重點細分方向。
此次一連發布四款模型,背後體現的是螞蟻集團一直以來在 AI 端的自研技術。
目前具身智能行業整體呈現硬件發展優於、快於軟件,只有通過自研高性能模型才能實現軟硬聯動時的效能可控和能力可定製,從而進一步推動機器人在實地場景中的有效率運作。
同時不可忽視的是,具身智能的發展需要軟硬件全棧精通,螞蟻集團的自身優勢在於軟件和場景,在機器人硬件領域的積累相對薄弱。
所以,投資是補齊短板與生態佈局的關鍵。
2025 年全年,螞蟻集團在具身智能賽道出手頻繁,是互聯網大廠中投資最活躍的企業之一,其投資佈局極具針對性,精準切入產業鏈各核心環節。
既投資了宇樹科技這樣重硬件的公司,也有星塵智能、星海圖等全棧式且有科研合作空間的公司,以及靈心巧手、鈦虎機器人等產業鏈上游公司。
這些投資動作,形成了機器人本體 - 核心零部件 - 技術研發的完整投資佈局,讓螞蟻集團快速補齊了硬件短板,實現了軟件 + 硬件的協同發力,為靈波科技的技術落地提供了硬件支撐。
模型發佈即開源是螞蟻最具戰略眼光的一步,也是區別於友商的核心優勢之一,因為絕大部分公司都沒有做到這一點。
除了開源四個核心模型外,螞蟻靈波還提供了模型權重,更開放了包含數據處理、高效微調、自動化評估在內的全套工具鏈。
這一系列動作背後是技術 + 生態的雙向構建。
首先,開源是快速構建開發者生態的最有效方式。通過降低全球開發者的使用門檻,吸引他們基於 LingBot 系列模型進行開發。
其次,這能加速整個行業的成熟。歸根結底,開源是為了加速具身智能技術的迭代與規模化應用。行業蛋糕做大了,位於底層的大腦提供商自然獲益最大。
最後,開源能形成數據與反饋的反哺。廣泛的開發者應用將產生海量的場景數據和優化需求,進而推動靈波自身的模型持續迭代,形成越用越強的正向循環。
通過自研 + 投資 + 開源的一套組合拳,螞蟻集團實現了技術 + 硬件的自主可控,技術迭代 + 生態構建的正向循環以及產業鏈整合 + 生態擴大的協同效應。
每一步都直擊行業痛點,為的是追求整個產業鏈的協同發展,最終實現1+1+1>3的效果。
3、在具身智能上不斷戰略分化的大廠們
過去的 2025 年,無疑是具身智能賽道的爆發元年。
隨着行業熱度的持續攀升,字節、美團、百度、京東等各大互聯網大廠紛紛高調入局,高舉高打投資具身智能相關公司,一時間賽道羣雄逐鹿。
但熱鬧背後,大廠們的佈局態度、核心方向、落地成果也呈現出明顯的分化態勢。
騰訊是大廠中佈局具身智能最早的玩家之一,早在 2018 年 3 月就成立了 Robotics X 實驗室,聚焦機器人技術研發,但實驗室並不以商業化作為運營目的。
目前其實驗室成果是具身智能開放平台 Tairos,平台包含模型算法和雲服務兩大組成部分,主打即插即用的模塊化軟件服務。
騰訊主打的是產品平台化,目前越疆、帕西尼、宇樹都有跟 Robotics X 實驗室進行合作。
字節跳動在具身智能領域的佈局相對低調,具身智能的相關研究集中在 2023 年成立的 Seed 團隊。
Seed 的重點在於模型研發,2025 年其團隊推出了 VLA 模型 Seed GR-3。該模型能夠理解抽象指令、操作柔性物體,並具備良好的泛化能力,能夠有效處理長程任務並能進行高靈巧度的操作。
同時,通過相關基金機構錦秋基金,字節在 2025 年也投資了產業鏈上下游的多家企業。2026 年 1 月,字節跳動聯合紅杉中國、深創投等機構完成了對自變量機器人的十億元融資。
美團則是在 2022 年成立了機器人研究院,核心優勢是場景貼合。
依託自身在本地生活、物流配送等領域的場景優勢,聚焦於與自身業務相關的具身智能方向,主要包括無人機配送、靈巧手、遙操作系統。
美團的策略是產學研合作,其明確表示研究院致力於搭建連接產業與學術的開放科研平台,通過真實場景反哺前沿研究,讓科技成果更快走向應用。
京東在具身智能領域的佈局起步較晚,直到 2025 年 3 月才開始加速佈局,但其投資態勢迅猛,成為 2025 年具身智能賽道的投資黑馬。
與螞蟻集團類似,京東的核心佈局策略是投資 + 場景協同,其先後投資了千尋智能、帕西尼、RoboScience、逐際動力等六家公司。
除了密集投資,京東內部也成立了相關業務部門,有多個團隊沿不同路線探索落地可能性,並將京東角色大模型驅動的對話智能體植入機器人、機器狗、AI 玩具等硬件中,與十餘家頭部機器人品牌達成合作。
對比上述各大廠的佈局,螞蟻靈波雖然並非出發最早的玩家,但憑藉實幹和閉環的差異化優勢異軍突起。
總的來看,靈波的優勢在於以下三點:
- 投入集中且聚焦,資源投入傾向明顯
- 佈局系統且完整,形成自研 + 投資 + 開源的生態閉環,軟硬件協同發展
- 成果落地快且有明確落地價值
經過了 2025 年資本盛宴、量產狂歡的野蠻生長,2026 年具身智能賽道的競爭無疑會逐步從單點技術比拼轉向系統性閉環比拼,從概念炒作轉向落地為王。
而無論是暗自攢勁默默佈局的大廠們,還是已經高調秀肌肉的螞蟻靈波,大概都會圍繞三個方向進行自我優化。
第一是補齊自身短板,從單點佈局轉向系統性閉環。
當前,多數大廠的佈局存在一定短板,要麼相關人才團隊建設滯後,要麼缺乏硬件支撐,要麼沒有核心落地場景,未來,各大廠或許會借鑑螞蟻集團投資 + 自研 + 開源的模式,構建完整的生態閉環。
第二是聚焦生態共建,開源成為核心競爭高地。具身智能的研發難度高、產業鏈長,單一企業難以完成全鏈條的技術突破和產業化落地,閉門造車難以適應賽道競爭節奏。
未來,各大廠將抓住開源生態,通過開放核心模型、工具鏈等資源,吸引全球開發者、中小企業參與生態建設,形成開源 - 數據反饋 - 技術迭代 - 生態擴大的循環。
第三是錨定場景落地,服務業成為當下核心突破。
服務業領域,目前餐飲、養老、文旅、社區服務等行業普遍存在人力短缺、服務效率低等痛點,具身智能機器人的落地需求迫切,也是從技術實現角度而言最容易觸達的場景。
縱觀大廠們或高舉高打、或低調潛行的佈局,螞蟻靈波選擇了一條更接近本質的道路:迴歸場景、構築生態、分享核心。
這或許意味着更慢的炫技節奏,但卻指向了一個更紮實的商業化未來。
畢竟,具身智能的產業化,從來不是單一技術的勝利,而是戰略佈局、技術實力與落地能力的綜合比拼,這也是行業從野蠻生長向成熟規範轉型的核心邏輯。
$阿里巴巴(BABA.US) $京東(JD.US) $騰訊控股(ADR)(TCEHY.US)
本文版權歸屬原作者/機構所有。
當前內容僅代表作者觀點,與本平台立場無關。內容僅供投資者參考,亦不構成任何投資建議。如對本平台提供的內容服務有任何疑問或建議,請聯絡我們。

