馬斯克都沒做到的事,彭志輝和他的智元機器人做到了。不久前,特斯拉確認旗下人形機器人產品 Optimus Gen3 將在今年夏天啓動小批量試產,2027 年才有望大規模量產。儘管這個節奏已經歷經多次跳票,但馬斯克的願景依然是全球行業的參考系。但轉折很快不期而至,本來要按 “年” 來規劃的爬產進度,被壓縮到了 “月” 的單位。3 月 30 日,智元機器人宣告量產基地走出的人形機器人突破了一萬台。這距離他們上一次舉辦五千台下線儀式,過去了不到三個月。智元的 “破萬” 意味着國內具身智能從實驗室,踏進了規模商業化的節點。 對於這家成立不到三年的中國玩家來説,在量產這件事上贏過行業巨擘,這本身就是一種宣言。 突破量產之壁 如果把過去兩年國內人形機器人的發展畫一條曲線,2023—2024 是 “Demo 曲線”,2025 年開始進入 “工程現實曲線”。兩條曲線的分野在於,前者依靠算法、動作庫、場景編排和渲染就能造出 “效果”;後者只接受一個標準:連續無故障運行。"在很多人眼裏,量產製造好像就是流水線、開模、注塑、組裝等一系列標準化的流程。但實際對人形機器人產品品類來説,規模化本身就是最難的技術問題之一。"3 月 30 日,在會後的訪談中,智元聯合創始人、總裁兼 CTO 彭志輝向華爾街見聞指出,機器人行業規模量產遠比想象中困難的多。他作了一個對比,消費電子出了故障大不了重啓;但機器人一旦失誤,"任何一點微小的品質故障都會在實際運行過程中被無限放大,可能會造成人員受傷、環境破壞後果嚴重"。這件事的難度,在智元內部 2024 年的量產階段體現得很徹底。智元高級副總裁兼通用業務部總裁王闖向華爾街見聞回憶,在那一年裏,智元正處於從第 1 台艱難爬坡到第 200 台的階段,這是公司的 “至暗時刻”。當年 8 月新品發佈會後,智元一口氣發佈五款機器人,其中最火的遠征 A2,單台售價超 50 萬元。 發佈會後,訂單如雪片般飛來,但智元卻完全接不住——產品無法量產,技術無法落地,商業模式完全走不通。王闖説,當時生產線幾乎沒有標準化可言,做出來的機器越多,團隊能用於幹活的時間反而越少,因為大量時間都被消耗在維修上,每台下線的機器人甚至都不一樣,工程師必須逐一調參。那是一段用人力填補工業化鴻溝的苦日子。到了 2024 年年底,為了解決第一批量產帶來的海量問題,智元先後有 150 多人次的研發人員駐紮在工廠一線。每一個量級的跨越,解決的都是完全不同維度的問題。接下來,從 200 台到 1000 台,最大的瓶頸從產線轉移到了供應鏈。彭志輝向華爾街見聞透露,智元最早決定做人形機器人的時候,去行業裏調研了一圈,"發現並沒有能夠適配我們、批量交付、成熟可靠的核心部件供應商"。智元內部員工稱,早期的供應商湊一湊交個一兩百台的貨或許還能應付,但當訂單規模達到千台甚至萬台時,原有的體系和質量標準便瞬間崩潰,產品根本經不起大批量的返工折騰。傳統關節、減速器、靈巧手、電池沒有任何一家供應商能滿足千台級的交付穩定性,更不要説一致性。既然沒有現成的路,智元只能選擇自己修路。彭志輝説,“我們是和供應鏈一起成長,把他們拉進來做聯合研發”。從材料工藝到工裝夾具,從測試台架到老化流程,全部重新定義。智元在關節、靈巧手等核心零部件上採用了與供應商聯合研發的新工藝,讓部件更輕、更準、壽命更長、成本更低。他們還構建了"半小時供應圈",要求核心供應商必須在半小時之內能響應。這種深度綁定的供應鏈策略,在短期內看起來很重,但長期來看,恰恰構成了智元的護城河。 工程複利的開端 如果説供應鏈能力決定了智元能不能造出一萬台機器人,那數據飛輪的複利,則決定了這一萬台機器人造出來之後能產生多大的價值。"以前做機器人的思路是先造一個本體,先把身體造出來,有一個硬件,再往裏面開發塞一些'大腦'、模型、算法。但現在隨着一萬台機器人下線,身體和大腦開始同步進化。"彭志輝如是説道。如今,每一台下線的機器人都會被部署汽車製造產線、3C 電子車間、商業服務空間持續收集數據。 這些真實數據反過來又會以前所未有的速度訓練智元的基座模型,使得模型變得更加泛化、更加實用,從而推動機器人解鎖更多的複雜場景。"機器人會越用越聰明。"彭志輝説,"一萬台是讓我們飛輪徹底轉起來的關鍵節點。"事實上,這個邏輯和智駕行業的演進路徑高度一致。斯拉的 FSD12 之所以能在 2025 年前後實現質的飛躍,核心原因就是數百萬輛在路上行駛的車輛持續貢獻真實駕駛數據。眼下,智元正在人形機器人領域復刻同樣的路徑。在王闖看來,任何一項顛覆性技術在早期發展時,都會讓人覺得步履維艱、無比緩慢,但當它真正跨過某個奇點,像海嘯一般席捲而來時,所有人都會驚呼它的速度太快了。 就像曾經的電動汽車和智能駕駛一樣,人形機器人也正在逼近這個爆發的臨界點。根據 IDC 的數據,2025 年全球人形機器人出貨量接近 1.8 萬台,同比增長約 508%。其中,中國企業在全球出貨量中佔據了主導地位,超過美國同行。2026 年,行業進入規模量產攻堅期。集邦諮詢預測全球出貨量將突破 5 萬台,同比再增超過 700%。智元在開年不到三個月就完成了萬台下線,按照這個節奏,王闖在發佈會上給出了預測:"十萬台可能是在 2027 年年底。"這個預測建立在兩個前提之上,首先是全自主的技術部署態,讓機器人脱離人的操控,理解環境、自主充電、持續適應更復雜的任務;二是全球化,王闖説,“機器人品類需求全球都是通用的,老齡化、少子化、勞動力不足以及枯燥重複的崗位越來越招不到人,這是全球面臨的問題”。從 2023 年 8 月問世的遠征 A1,到 2026 年 3 月第一萬台遠征 A3 走下產線,智元用不到三年的時間完成了一個幾乎不可能的跨越。這家公司的故事,本質上是中國製造業系統能力在一個全新品類上的又一次集中釋放,同樣的劇本已經上演過很多次,但每一次依然令人震動。一萬台不是終點。但從這一天開始,人形機器人不再只是想象中的未來概念,而是當下的產品。 以下是華爾街見聞·全天候科技與智元聯合創始人兼 CTO 彭志輝、高級副總裁兼通用業務部總裁王闖的對話實錄: 全天候科技:在萬台量產的背後,智元在供應鏈、成本控制、產能上做了哪些關鍵佈局? 彭志輝:剛才也提到了一萬台的難度有多大,從一千到一萬的過程用了一年多的時間,完成了 10 倍量級的跨越。這背後挑戰的是在製造效率、場景落地、客户價值、數據飛輪、供應鏈共同成長五個維度的綜合能力體現。可以説,智元是全球首個真正跑通從實驗室樣機到工業化大規模交付全流程的智能公司,最大的難點是批量一致性和成本控制挑戰。機器人不像手機,出了問題,軟件問題重啓,硬件問題也不會有什麼損傷。但是機器人一旦失誤,任何一個環節掉鏈子,量產品質會崩盤,也會給用户、給環境帶來不可逆轉的傷害。核心零部件的穩定供應、整機的成本壓降、品質、質量、穩定性、可靠性都是 “硬骨頭”。為了搞定這些問題,有兩件事情比較重要:第一,死磕供應鏈。和供應鏈共同成長,重新定義新行業標準。我們建立了全球首個具身智能標準化供應體系,甚至把核心夥伴拉進來一起搞聯合研發,比如説在關節、靈巧手等核心零部件上採用了新工藝,這些工藝是跟供應商聯合研發的,讓部件更輕、更準、壽命更長、成本更低,會體現很強的產品優勢。第二,重構生產模式。包括我們現在所在的場地搞了中試工廠的驗證工藝,量產工廠保證穩定,中試工廠是提前驗證各種工藝和組裝的流程。還通過訂單驅動等柔性生產的方式,不僅把核心零部件做到了自主可控,而且還構建了 “半個小時供應圈鏈”,提出了一些對供應商的訴求,供應商必須在半小時之內能夠響應。萬台不是終點,而是證明我們有能力用工程化的確定性把具身智能真正從玩具變成未來的生產力必不可少的關鍵節點。全天候科技:具身智能的 ChatGPT 時刻到了嗎? 王闖:最大的區別是客户經常反饋產線會經常變更,比如説電芯上下料的產線可能過段時間就改造成其他不同型號的電芯,甚至是完全不同的物料上下料。如果用傳統自動化方法的話,經常需要把以前做得好的設備報廢掉,再開發新的設備,至少是讓工程師再駐場一個月開發新的算法。具身智能最大的意義在於泛化性,就像我們現在用 GPT 問它任何問題,有很多都是模糊的回答,你問的非常模糊,但它能夠泛化的理解。我們希望在具身智能的物理世界中也能夠泛化性的理解它要做什麼,這可能有非常大規模的預訓練,再加上針對工位採集數據進行強化的訓練,最終讓成功率達到產線能夠接受的成功率,產線往往是 999、9999 的標準,節拍要和人進行對標。現在我們看到在一些上下料的場景已經逐漸開始跑通了,希望未來輪式在工廠的更多場景,以及雙足機器人在接待、導覽、導購的場景也能逐漸跑通。全天候科技:近期智元在算法、仿真技術等方面接連取得最新突破,第一萬台下線的機器人是否搭載了這些技術成果,萬台規模量產所帶來的真實數據與工程反饋,又會如何反哺技術的迭代與真機的場景適配能力? 彭志輝:數據閉環/數據飛輪對我們來説非常有價值和有意義。第一萬台量產下線是遠征 A3,是最新推出的新型號產品,現在還沒有達到批量出貨的階段,很多軟件功能還沒有達到階段,還在繼續持續優化。很多新技術肯定會率先在新產品上做應用和驗證,比如 A3 在本體方面的輕量化、續航、推重比、交互能力上都有了大幅度升級,整機只有 55 公斤,比大多數這個尺寸的人類還要輕,續航能達到 10 小時以上,還搭載了各種新型傳感器(比如觸摸傳感器)。更核心的是 “大小腦” 軟件跟算法模型,融入了最新的全身運控的模型,包括羣控的算法,可以羣體控制的算法成果。目前除了像遠征這樣的新型號,之前已經發布的產品也已經在真實場景裏落地應用了,比如説 “精靈” 系列,已經在工業製造、物流、安防等場景落地。像我們在龍旗科技的平板電腦產線就有我們的 A2 24 小時不斷幹活兒,做屏幕的上下料。G2 還在均勝這種電子工廠,能以 12 秒多超過人類的速度完成高難度的工裝、三銷定位的裝配,成功率幾乎做到 100%,這些場景本質上對機器人的精度、穩定性要求都非常高,是傳統自動化解決不了的。正是這樣的場景非常能體現具身智能的價值,不是替代人類,而是要讓機器人具備一次訓練、多次部署的泛化能力,補充人類的工作崗位。“數據飛輪” 也是過程中最大的紅利,在真實環境裏不斷幹活兒,也能給我們收集足夠多的數據,數據能幫助我們突破未來具身智能的能力上限。新下線的機器人是在 “出廠即進化” 的一條路上,依靠仿真數據和真機數據,現在有了真實的數據飛輪閉環,為機器人未來能夠真正進入大規模生產力價值場景做非常好的鋪墊。全天候科技:現在這一萬台機器人將分佈在哪些領域,哪些具體場景的 ROI 已經跑通了? 王闖:我們現在有 8 個主要的商用場景,有科研用户、數據採集、文娛表演,更多是開發態。在部署態有做講解接待、工廠上下料場景。未來會探索出更多場景,比如説做真正的前台接待,能夠帶有交互、帶有作業,比如説在工廠裏一個工位做一些事情之後,能很快的調整到另一個工位,像真正的 “人” 一樣工作。全天候科技:現在行業正處於百花齊放的狀態,無論是形態、算法、場景應用,智元如果要成為終局的獨角獸,最重要的壁壘是什麼,整個具身行業有沒有收斂出來的共識? 彭志輝:我們一直有對外宣講,我們的核心壁壘就是我們堅持的 “一體三智” 的全棧戰略,之前每一次產品發佈也都會強調,為什麼我們要做大而全全棧的技術佈局,而不是專精在某一塊。因為我們是以終為始,瞄準最終的應用場景,要跑通真實的場景,單靠一個技術點是打不穿的,既需要機器人有很強的交互能力,作為很好的人機交互界面,又需要它能真正幹活兒,又需要它的運動能力足夠強,區別於傳統固定式的工業機器人。所以既需要運動智能,又需要交互智能,又需要作業智能,同時本體要足夠成熟、可靠、穩定、低成本,是系統型的工程,為什麼我們始終堅持 “一體三智” 全棧的技術路線,把機器人的本體、運動智能、交互智能、作業智能深度做系統融合。我們在 AI 底層大模型、垂直行業應用上也積累了大量 Knowhow,這些 Knowhow 也是我們自己的 “護城河” 之一。剛剛提到建立了全球首個標準化的供應鏈生態,這也是很強的護城河。全天候科技:當前機器人正處於從 “擬人” 向 “類人” 進化的階段。過去一年機器人 “大腦” 有哪些進化?在靈巧手負載和全身力控平衡方面,距離理想的 “數字生命實體” 還有多遠? 彭志輝:這是對未來的暢想。首先,機器人大腦的進化是主旋律,為什麼這幾年人形機器人會這麼火?並不是因為本體有什麼突飛猛進的黑科技,而是因為 AI 的發展、大模型的發展,從 2023 年 ChatGPT 為代表大腦的進化才是主旋律,在過去一年這個時間變化非常快,早期在大腦這塊更多是用類似 ACT、Policy 這樣的技術,能解決序列生成的問題,但本質上還是偏動作預測。現在學術界、工業界主流的趨勢全面轉向了 VLA,基於大模型的 VLA 技術。這不僅是換個模型架構的問題,而是讓我們真正開始嘗試想去延續大語言模型那個神奇的所謂的 Scaling law,堆規模、堆數據、堆算力,希望讓機器人的通用智能能湧現出來。這是大範式的轉變。同時,技術也是持續演進迭代的,比如説未來的世界模型也會發揮很重要的作用,能讓機器人像人類一樣做所謂的反事實推演。人類做一件事情的時候會先在腦海裏推演一遍下個動作帶來的後果,再動態的調整自己的策略。而不只是看到什麼就做什麼,這才是從感知到反應,從認知到規劃的根本性跨越,當然還需要技術的不斷迭代和演進。核心零部件現在也還存在瓶頸,比如説靈巧手硬件目前還是很大的瓶頸,如果我們需要非常高自由度、高負載,有很強的感知能力。比如觸覺做的非常好,同時又要非常低成本。這幾點在工程上是非常矛盾,現在整個硬件方案都還沒有收斂,我們也在嘗試不同的技術路徑、新的結構設計方案、新的傳感器選型,試圖能夠在性能和成本之間找到比較完美的平衡。剛剛提到了 “一體三智”,每個領域的算法基座模型都還需要做一定的迭代。最後離我們想象理想中的數字生命體有多遠?我的看法應該是會比一部分人想象得快,但還需要一定時間,不管是身體還是靈魂。“身體” 剛剛講了硬件還是有些需要突破的空間,工程化、成本也在動態平衡的過程中。“靈魂” 是大腦和小腦,更重要,通用智能、對世界的理解、長期決策、跨語義多模態聯動還處在相對早期的階段。但也正是因為這條路沒有那麼簡單,中間有這麼多硬骨頭要去啃,才是非常值得我們全力投入、去死磕、去突破的原因。 全天候科技:中國機器人行業存在泡沫嗎? 王闖:任何技術的發展在早期的時候大家看着都是比較慢的,在它真正像 “海嘯” 一般來臨的時候大家會覺得太快了。可以想象一下電動汽車,汽車電動化十幾年來國家都在補貼,一直在推廣。但普通老百姓購買比例一直都非常低。事情就發生在最近兩三年,好像突然加速了,充電樁可能比加油槍在某些城市還要多了,滲透率超過了 50%。汽車的智能化也是的,智能駕駛研究了幾十年,剛開始的時候大家都覺得這個技術體驗太差了,都不太想用。最大的變化在最近一年,我自己體驗各種第一梯隊的智駕,已經能讓我非常放心地使用它了,這是非常革命性的時間點來臨。人形機器人也是一樣,複雜度只會更高,像遠征 A3 現在裏面用了非常多新材料、新傳感器,主控算力也進行了大幅提升。這麼複雜的產品現在才剛剛下線第一批,裏面還有很多很多問題要解決。對我們來説,希望踏踏實實把每一步都走穩,把東西、產品真正做好,也期待着過程中有很多合作伙伴、上下游供應鏈、客户跟我們一起努力,把產品做好。做好之後會把它先在力所能及的場景中用起來,比如説機器人剛開始的泛化性相對有限,不能説所有的任務都讓它做,但約定一些種類的任務已經做得非常好了,因為它重複性執行和 24 小時不睡覺是天然跟人類相比的優勢,可以幫助我們來做枯燥重複的事情。接下來就是靜靜的等待着加速的過程,我現在也説不好是 5 年、10 年還是更長,但相信某一天如果大家看到很多機器人能真的在身邊幫我們做一些事情的時候,大家會覺得這個過程發生得很平靜又很自然,並且能深刻的改變社會。我非常非常期待這個時間,我會把自己未來的職業生涯都奉獻在過程中,跟同事一起努力。至於中國跟國際的對比,很顯然在國際上有很多從 0-1 的創新做的非常非常好,中國在從 0-100 的過程做的非常好,尤其是在工程能力、應用及構建起機器人迭代的 “飛輪” 方面都做的非常好。最近一兩年我有很大的體會,中國在一些核心技術的從 0-1 上開始逐漸有突破,比如説機器人觸覺、算法,像機器人感知和控制相結合的算法,中國都有很多很好從 0-1 的東西出來。我相信在未來中國學從 0-1 會學得很快,會越來越加速,因為有足夠多聰明的人。但其他國家學中國的從 1-100 沒有那麼容易,可能構建起整個體系需要巨大的努力和相對很低的成功率,我相信在具身智能產業裏,中國會持續領跑全球。全天候科技:如何看待目前人形機器人你追我趕的競賽,智元的下一步目標是什麼? 王闖:我們並不是在做 “量產競賽”,現在大家所在的工廠是中試工廠,像遠征 A3 是在這個工廠生產的,更多是用來驗證整個產線。其實這個工廠裏大部分都沒有用到自動化設備,是驗證、設計,研發也經常會跑過來迭代產品設計。真正量產工廠在奉賢工廠及其他地方(工廠)。我們現在如果想做量產競賽的話,產能遠不止現在這點。為什麼沒有做呢?因為我們更看重的是機器人怎麼在真實場景中用起來,怎麼滿足客户可持續的需求。比如客户買了機器人在產線上驗證,需要先做 POC 讓功能跑通,比如節拍達到 12 秒或多少,客户真正滿意了才會在其他類似的工位上逐漸推廣,這是有真實需求驅動的。還有雙足的,像靈犀、遠征機器人用在展廳講解,現在也有累計有兩三百台在不同的展廳工作。如果客户覺得自主免維護、機器人交互能力、接待能力、多語言能力真正能幫助到他的時候,他願意批量化複製和推廣的時候才是我們最期待的,這時候會根據客户的需求安排產能,並不會想着跟誰競賽,因為生產出來變成庫存對我們來説是沒有意義的。