放棄動捕,全面轉向純視覺數據採集,特斯拉 Optimus 最新訓練進展曝光!

華爾街見聞
2025.11.03 07:38
portai
我是 PortAI,我可以總結文章信息。

據報道,特斯拉已將人形機器人 Optimus 的訓練方式從動作捕捉轉向純攝像頭數據採集,數十名數據採集員工在實驗室內重複執行(擦桌子、提杯子、拉窗簾等)日常動作,為機器人學習人類行為提供視頻訓練素材。

特斯拉正用純視覺數據訓練 Optimus,讓機器人真正用 “眼睛” 理解世界。

據 Business Insider 最新報道,特斯拉已將人形機器人 Optimus 的訓練方式從動作捕捉轉向純攝像頭數據採集,數十名數據採集員工在實驗室內重複執行日常動作,為機器人學習人類行為提供視頻訓練素材。

報道稱,自今年 6 月起,特斯拉放棄了此前使用的動作捕捉服裝和遠程操作方式,轉而採用僅依靠攝像頭的數據收集方法。工人們頭戴裝有五個攝像頭的頭盔,揹負重達 30-40 磅的設備包,反覆執行擦桌子、提杯子、拉窗簾等基礎動作。

馬斯克在第三季度財報電話會議上稱 Optimus“有潛力成為有史以來最大的產品”,並預計該公司最終將每年生產 100 萬台機器人。他還表示,Optimus 有一天可能佔到這家汽車製造商價值的 80% 左右。

訓練方式全面轉向攝像頭數據採集

特斯拉工程總部的一個玻璃實驗室內,數據採集工人們執行着看似簡單但極其精確的重複動作。每個動作都要在 8 小時輪班期間重複數百次,所有行為都被頭盔上的五個攝像頭和揹包設備完整記錄。

今年 6 月,在項目總監 Milan Kovac 離職後,公司告知員工將從動作捕捉服裝和遠程操作轉向僅使用攝像頭收集數據。工人表示,團隊被告知這種方式能夠更快地擴展數據收集規模。

除了工人身上的攝像頭設備,特斯拉還在工作區域周圍設置了固定攝像頭。謝菲爾德大學機器人專家 Jonathan Aitken 表示,這些固定攝像頭塔能夠提供更廣闊的環境視角,補充身上攝像頭的數據。

工人們有時還配備觸覺手套,用於追蹤手部的細微動作。馬斯克曾表示,特斯拉在為 Optimus 開發類人手部方面投入了大量精力,稱其為"極其困難的工程挑戰"。

AI 生成任務指令覆蓋複雜動作場景

特斯拉已開始使用 AI 生成的提示來幫助訓練機器人。在某些訓練練習中,工人通過連接到揹包的頭戴設備接收一系列 AI 生成的指令,需要在 3-5 秒內完成每個動作。

據工人描述,這些練習包括下蹲、做 “雞舞”、模仿大猩猩、假裝吸塵、短距離衝刺、假裝打高爾夫球等動作。一些任務甚至包括嬰兒智力遊戲,如按大小和顏色套環,或將形狀放入相應的槽中。

兩名數據採集員提到,有些 AI 生成的任務讓他們感到不適,包括四肢爬行或脱掉衣服的要求。不過專家認為,這些看似隨機的任務可能幫助特斯拉了解需要改進的領域。

在弗裏蒙特工廠,數據採集員還會在佩戴頭盔和揹包的情況下整理車輛零件,在傳送帶上工作。專家表示,為同一任務收集不同的數據點對訓練很有幫助。

機器人實際表現仍面臨技術挑戰

儘管在公司視頻中,Optimus 能夠行走、疊衣服、表演功夫動作並在時代廣場分發糖果,但實際訓練中的表現差距明顯。

報道稱,兩名工人表示,機器人在執行需要彎曲或傾斜的任務時,有一半時間會摔倒,有時會損壞昂貴的設備。除非執行需要移動超過幾英尺的任務,否則通常會被綁在支撐架上保持直立。

Aitken 表示,在特斯拉辦公室這樣的受控環境中,機器人應該能夠輕鬆保持直立。“讓它站起來並保持平衡應該是你首先要解決的問題之一。”

俄勒岡州立大學 AI 和機器人專家 Alan Fern 指出,機器人演示 “總是他們能向你展示的最好演示”。當看到它表演功夫時,雖然看起來在做智能的事情,但 “它只是對環境做出反應,背後沒有認知思考”。

目前,超過 100 人曾參與數據收集工作,但公司在 9 月的半年度績效評估後裁減了數十名數據採集員。工人們根據任務執行情況評分,每個輪班需要收集至少 4 小時的可用視頻素材。