
端到端自動駕駛落地,需要「對口」的雲加速器

新車發佈會上,車企公佈智駕行駛里程,已經成為了智駕秀肌肉的基本操作。譬如 8 月份,鴻蒙智行公佈了智駕里程達到 2 億公里。
車企之所以把智駕行駛里程拿到枱面上講,原因在於,這些真實的里程數據,構成了車企在智駕訓練上的數字資產,幫助車企在模型訓練上不斷迭代升級。
這個過程發生在雲端。
事實上,一個循環的數據流程在車端、雲端之間 24 小時不間斷運轉。即車端將數據反饋給雲端,在雲端集中進行模型訓練與仿真,再把模型數據發回車端形成閉環,完成 OTA 部署及更新。
所以車企總喜歡把「開得越多,越好開」放在嘴邊,因為底層邏輯正是這樣。這種「端到端」正是自動駕駛大模型固有的訓練方式。
不過,這和現在行業熱議的端到端自動駕駛並不同,它指代的則是一種技術路徑,從輸入端到輸出端,從前被切分開的感知、預測、規劃、控制等任務模塊,貫穿成一個巨大的 AI 神經網絡,它能像人類大腦一樣快速作出決策。
有意思的是,這兩種「端到端」正碰撞到了一起,還對模型訓練提出了更高要求:
- 採集、存儲百 PB 級別的數據量;
- 對高質量數據實現高效率處理、訓練;
- 完成從感知到規控一體的仿真測試;
- 保證數據全流程的合規安全;
……
顯然,這需要車企/智駕供應商投入巨大的時間成本與人力成本,構建出一套成熟、合規、穩定的數據工具鏈,以此支撐 AI 模型高效地迭代升級,模型的迭代效率越高,智駕產品落地速度越快,性能表現得越好。
對於車企/智駕供應商而言,從零搭建地基,挑戰很大。
而以百度為代表的智能雲服務商都看準了這種為車企賦能的巨大機遇,在汽車雲建設上打造了一整套數據工具鏈,貫穿數據採集、標註、管理、仿真、測試等全流程,支持了業內大批企業自動駕駛服務的落地發展。
在最新一屆百度雲智大會上,百度汽車雲迭代到 3.0 版本,圍繞着端到端自動駕駛的特性對工具鏈做了針對性優化升級,助力自動駕駛玩家們打造高效運轉的數據閉環,攻克端到端自動駕駛的落地難點。
01、用生成式 AI 解開「數據劫」
端到端技術範式,是行業公認通向高階自動駕駛的最優解。
這種與 AI 深度綁定的技術路徑,相當於把摩天大樓繼續築高,無疑給充當地基的數據工具鏈施加了更大壓力。
一方面,數據規模開始瘋狂擴大,數據處理難度上升。
一個大致標準是:
- 實現 L2、L3 級的自動駕駛 Demo 模型,只需要百萬張圖片的數據量;
- 實現 L2、L3 級自動駕駛的量產,需要億張圖片,數據量大於 100T;
- 實現 L4 級的自動駕駛 Demo 模型,存儲數據量從 T 級進化為 P 級;
- 最後,實現 L4 級的自動駕駛量產,數據量已經大於 50PB。
很明顯,每上升一個難度或層級後,數據處理變得越來越難掌控。
如果把自動駕駛數據處理鏈條攤開,可以看到這個流程包括篩選、清洗、標註等重點環節,這個步驟的關鍵目的是把真實數據變得有用。
端到端自動駕駛對於「數據有用」的定義,是系統通過數據訓練實現強大的泛化能力,能夠像老司機一樣,應對各種複雜多變的駕駛場景,包括 Corner case(極端情況),如行人突然橫穿馬路、多路口環島路線、極限直角型轉彎等。
用一個比喻來講,就是訓練出一個聰明大腦,它不僅會做大量的常規題目,面對沒有做過的難題時,也能冷靜思考,合理分析,通過舉一反三的方式寫出正確解法。所以訓練策略上需要注重廣度和深度,用來訓練的數據要足夠豐富、多樣、具備挑戰性。
這就要求數據處理過程中,能從海量數據庫中快速挖掘、標註這些高質量的題型,構成一個優質的訓練集。
另一方面,仿真訓練的邏輯發生變化,成為新的難題。
仿真訓練相當於自動駕駛研發最後一道防線,驗證評估。它好比一個專業的評價體系,給模型打分,分數高的才能進行到下面的車端部署環節上,分數低的則要找到 bug 點,回到訓練模塊重新優化。
目前,自動駕駛的測評分為兩類,開環評估與閉環評估。
- 前者對於不同任務可以單拎出來,例如單獨評估感知、預測、規劃等環節的效果,與真實數據或標註數據相比對;
- 後者指在仿真引擎構建的虛擬世界中建立反饋閉環,從輸入到輸出端接受反饋信號,與現在行業反覆提及的「世界模型」一個概念。
端到端自動駕駛由於感知、規劃這些環節都連成一體,意味着它只能走閉環評估的路線,這就要求,底層的數據工具鏈也能支持這種一體化的訓練方式。
另外一層難度,體現在仿真訓練更需要龐大的數據支撐,因為它的本質是要建立一個虛擬世界,模擬車在真實世界中遭遇的一切,比如遇到水坑怎麼過,前面迎面飄來塑料袋該做出什麼反應,這需要包含許多長尾場景,並且場景要全面、真實,因為它是模型最後的評價體系,如果評價體系都不專業,那整個模型訓練都是一場無用功。
所以,針對這些層面上的升級要求,百度汽車雲對數據工具鏈產品做了不同程度的升級完善,主要體現在兩點。
一是增加數據智搜功能,包括以文搜圖,以圖搜圖。
這可以幫助數據管理平台快速完成數據篩選,精準找到高質量、有價值的數據,比如需要一個公路上路面積水的場景,可以直接用一張圖、一句話描述,就能快速把相關數據鎖定、檢索出來,餵給 AI 模型做訓練。
二是對採集數據進行生成式動作,用真實場景做仿真。
這可以實現對真實數據的再利用,正常情況下,一組高質量的數據只能作為一次場景使用,但通過生成式 AI,把場景中某個障礙物抹除,再注入新的車輛,就能生成其他同樣真實的場景。
顯然,這是一種降本增效的有利解法,尤其對於場景匱乏,路測數據不足的企業而言,生成式 AI 在有限成本基礎上,讓採集數據在更多的泛化參數下,得到有效利用。
英偉達全球副總裁、汽車事業部負責人吳新宙認為,隨着端到端大模型上車,AI 將以無限度的規則重新定義汽車。
某種程度上,生成式 AI 與自動駕駛技術相結合,重塑智能化體驗,指向了高階自動駕駛的落地實現。
所以,要在汽車智能化下半場提高勝率,則是要學會四個字,借力打力,抓住 AI 這一變革力量,這是百度智能雲正在做的事。
另外需要強調的是,百度本身作為自動駕駛的頭號玩家,十年的研究歷程下來,擁有真實、海量、豐富的數據資源,比如在百度地圖支持下,擁有上百個國內主要城市全域數據,測試里程覆蓋千萬公里。這類豐富的數據資產對於建立仿真訓練平台有極大的優勢。
02、全鏈路訓練優化,把算力吃透
某智駕供應商曾表示,數據會佔據端到端自動駕駛開發中 80% 以上的研發成本。
這其中也包含了算力,龐大的數據資產需要強大的算力資源支撐。
尤其是仿真平台,大量仿真任務併發運行時,CPU、GPU 任務混合在一起,這對算力資源造車不小壓力。
算力成為了自動駕駛玩家們錨定的軍備競賽,這指向了兩種統一動作。
一是興建智算中心。
以特斯拉為例,其消耗數十億美金興建超算中心,預計今年底算力最高將達到 100E FLOPS。
國內智駕玩家顯然不具備這番資金實力,但在智算中心的算力投入上,一直不遺餘力的提高上限。
二是打造世界模型。
端到端自動駕駛對於「驗證」的高要求,使得世界模型/仿真平台成為智駕企業的加碼重點。
尤其是生成式 AI 出現後,這種模擬現實的強大工具被深度應用在世界模型/仿真平台的搭建中。
與之伴隨的,是對算力的高需求與高消耗。
據悉,端到端自動駕駛的起步算力,大概在 1000P 左右。越往上走,算力要求越高,成本負荷越重。
與此同時,還伴隨着一個難題,即算力效率低,如果算力冗餘,沒有得到充分利用,那在算力上花費的資金成本則又被砌高了。
所以關鍵是把有限算力發揮出最大價值,降低成本和時間,提高迭代速度。
百度智能雲的算力服務優勢由此凸顯出來,推出了百舸· AI 異構計算平台 4.0,提供了一套低成本、高效能的優化方案。
百度百舸 AI 異構計算平台 4.0
這裏值得一提的是,百舸平台為了追求訓練的極致性能,除了追求單卡本身的訓練性能,也重視多卡之間的並行效率。
這種多芯訓練,使得平台能夠支持不同類型的芯片算力運轉,包括 A100、A800、國產芯片等,還能夠支持萬卡規模的大型集羣,進而幫助模型提升計算效率。
另外,百舸平台這種端到端加速能力,對於不同的算法框架也做到了泛化性適配。
一個熱知識是,同一個算法模型在不同的訓練框架上獲得的優化能力不同,如果算法框架和模型的耦合能力差的話,還會造車算力資源使用差的負收益。
所以百舸平台基於自動調優策略,通過並行優化、顯存優化,各種算子、存儲、網絡的各方面優化行為,最大程度提高了訓練效能。
可以通過一組數據論證:
- 在標註場景下,百舸平台的 GPU 共享方案將自動化標註的成本降低了 1 倍以上;
- 在模型訓練場景下,百舸平台幫助模型訓練吞吐平均提升 138%,最高 400%,最多縮短 80% 的模型訓練時間;
- 在仿真場景下,百舸平台可以支持仿真平台實現日行百萬公里的仿真里程。
一個真實案例是,某頭部車企通過百度智能雲助力,模型訓練性能提升了 170%,GPU 的資源效率提升了 2.5 倍。
顯然,百舸平台作為強大的 AI 基礎設施,讓算力資源在多樣化場景下得到充分發揮,幫助智駕企業們抓住研發效率這個核心競爭力。
03、雲智一體,加速智能化終局
智能化的下半場,比拼的核心在於基礎設施——汽車雲的能力,這決定水面之上性能的上限。
在這種雲智一體的生態中,同樣能看到兩種趨勢正在生長。
一是車路雲結合,把路測的數據引入進來。
以往在路上開車,遇到交通事故、施工路段往往需要承受長達幾小時的堵塞折磨,這給出行帶來極大的不便利性。
而百度智能雲和路測交通集團合作,把數據聯通後。這些動態的路況,以及天氣信息,都能早早通過 AI 提醒獲得,用户可以提前根據信息規劃線路,保證出行的通暢。
比如,有車企就通過公交車的潮汐車道數據做路徑規劃,用户可以巧妙避開堵塞路段,提升駕乘體驗感。
值得一提的是,這種路況提醒,可以建立在不開啓導航地圖的基礎上,直接通過智能座艙實現。
這也指向了第二種趨勢,即智能座艙的體驗感越來越好。
在 AI 大模型上車後,智能座艙從多模態的交互性演變成 AI 的主動性越來越強。
也就是説,從用户主動發起問答式、指令式對話,AI 準確理解並回答、執行,變成 AI 主動揣測用户需求,在恰當的時機發起相關對話,推送對應功能等。
另外,智能座艙的體驗感也在逐步提升,比如極越 01、07 等車型上車了百度的座艙大模型後,能做到車外語音控制,通勤自動導航等功能,並且還能通過「哨兵模式」,在車未啓動時,幫助用户自動記錄到車輛剮蹭等意外情況,並自動啓動行車記錄儀保留證據。
一個確定路徑是,伴隨着自動駕駛、智能座艙向更高緯度的性能進階,雲服務商都在抓住這種為車企賦能的機遇,不斷推出具備競爭力的服務方案,在數據工具鏈的產力上內卷。
小馬智行 CTO 樓天城在最新採訪中表示,數據鏈的成熟度,決定了最後模型好壞的關鍵。
而有能力把數據鏈做到支撐 L4 的一定是百度。事實上,百度本身就在 AI 領域長期積累,打造的 Apollo 平台具備支撐 L2 至 L4 的量產落地實力。
而百度作為頭部自動駕駛科技企業,選擇以一種開放的心態來做雲服務,把核心工具鏈開放給行業使用。
根據全球領先的 IT 市場研究和諮詢公司 IDC 發佈《中國人工智能公有云服務市場份額,2023》報告顯示,2023 年中國 AI 公有云服務市場整體規模達 126.1 億元人民幣,百度智能雲市場份額以 26.4% 的成績排名第一。
值得一提的是,自 IDC 發佈中國 AI 公有云市場報告以來,百度智能雲已經連續 5 年蟬聯中國市場第一。
在汽車行業集體擁抱智能化的今天,沒有一家車企能做到全棧自研,絕大多數都選擇與雲服務商來個雙向奔赴,在強大的數字基建上構建智能化壁壘,也正是在這種合作共贏的生態下,智能駕駛的想象力能夠進一步延伸,並一步步轉變為現實。
$百度(BIDU.US)
本文版權歸屬原作者/機構所有。
當前內容僅代表作者觀點,與本平台立場無關。內容僅供投資者參考,亦不構成任何投資建議。如對本平台提供的內容服務有任何疑問或建議,請聯絡我們。


