作者 | 張祥威,編輯 | 德新
數(shù)據(jù)是智駕的核心
2023年,在比亞迪那次公布智駕數(shù)據(jù)規(guī)模后,智能化下半場的戰(zhàn)斗就正式打響了。
如今,自動駕駛正在沿著特斯拉提出的「BEV+Transformer」急速推進(jìn),這條技術(shù)路線短短幾年就得到了驗證,隨著智駕起較晚的比亞迪大舉進(jìn)場,讓新技術(shù)再次得以普及。
新路線的普及,也讓整個自動駕駛行業(yè)對數(shù)據(jù)提出了更高要求。
通常,激光雷達(dá)的算法要滿足自動駕駛的性能要求,需要至少幾十萬幀的數(shù)據(jù)訓(xùn)練。單目攝像頭要求更高,需要百萬幀的訓(xùn)練數(shù)據(jù)。不過這兩者和BEV方案比起來,差距仍然十分巨大。
自動駕駛采用的BEV感知方案,需要達(dá)到1億幀以上的訓(xùn)練數(shù)據(jù)才能滿足車規(guī)要求,否則泛化性、準(zhǔn)確率和召回率就難以保障。
如何獲取這么大規(guī)模的數(shù)據(jù),獲取之后如何有效回傳、標(biāo)注以及訓(xùn)練,并最終OTA反饋到車端,是數(shù)據(jù)閉環(huán)的核心任務(wù),也是大多數(shù)車企迫切想要擁有的能力。
近日,HiEV與覺非科技CEO李東旻進(jìn)行了一場對話,在過去幾年里,他基本上見證了車企對于數(shù)據(jù)閉環(huán)上車的完整歷程。
用他的話說,數(shù)據(jù)閉環(huán)已經(jīng)成為實現(xiàn)高階智駕的「華山一條路」,沒有一家車企可以繞開。甚至,本土車企在上馬數(shù)據(jù)閉環(huán)這件事上,已經(jīng)到了不預(yù)研也得上的程度。
特斯拉打造樣板間,車企爭相入局
要弄明白數(shù)據(jù)閉環(huán),還要回到自動駕駛的先鋒特斯拉,和那位大牛人物Andrej Karpathy(簡稱AK)。
2017年6月,馬斯克從OpenAI挖來AK,任命其為特斯拉人工智能和自動駕駛視覺總監(jiān)。次年在「Spark+AI 」的會上,AK展示了一頁寫著Data Engine字樣的PPT,上面列出了Data Source——notice a problem——boost——label——train——deploy的流程。
有心者會發(fā)現(xiàn),去年特斯拉AI Day上的那張圖,正是AK那張PPT的升級版本,只不過細(xì)節(jié)上做了完善。
Date Engine的中文名是數(shù)據(jù)引擎,簡單來說,就是將車輛行駛過程中獲取的數(shù)據(jù),通過一系列標(biāo)注、模型訓(xùn)練,最終將模型部署回車上,讓車駕駛得更好。
特斯拉不斷產(chǎn)生數(shù)據(jù)、訓(xùn)練數(shù)據(jù)的前幾年,其他車企、自動駕駛公司觀望者多,跟進(jìn)者少,車企很少像今天這樣大談「數(shù)據(jù)閉環(huán)」,直到2021年8月。
這年,特斯拉AI Day提出了「BEV+Transformer」的技術(shù)路線,讓自動駕駛從業(yè)者為之一振。原本的2D檢測面臨遮擋等Corner Case難以窮盡的問題,至此有了更有效的解題思路。
李東旻告訴HiEV,那場發(fā)布會后不久,不少國內(nèi)的自動駕駛行業(yè)人士在國際出行變得方便后,前往海外對特斯拉的車進(jìn)行了體驗,「覺得真的很震撼,從關(guān)注到相信,開始想嘗試?!?/p>
2022年初,主機廠開始頻頻談及數(shù)據(jù)閉環(huán)的方案,到下半年,車企搭建「數(shù)據(jù)閉環(huán)」能力的意愿愈加迫切,一些車企甚至有跳過預(yù)研直接上馬的想法。
跳過預(yù)研,風(fēng)險點在于感知、規(guī)控這一端,是否和另一端的數(shù)據(jù)閉環(huán)形成了很好的銜接。
正常來說,車企需要一邊保證量產(chǎn),另一邊進(jìn)行預(yù)研。對于數(shù)據(jù)閉環(huán),車企需要搞清楚自車產(chǎn)生的感知、規(guī)控的數(shù)據(jù)規(guī)格、質(zhì)量,能否很好地匹配另外一端的數(shù)據(jù)閉環(huán)。
不過,在智駕上車已成必然的當(dāng)下,留給車企的時間不多了。
一些車企發(fā)現(xiàn),要實現(xiàn)高階智駕,只有「數(shù)據(jù)閉環(huán)」這華山一條路,再加上特斯拉已經(jīng)打造了樣板間,所以有車企甚至敢于跨過預(yù)研,直接推進(jìn)研發(fā)。
車企、供應(yīng)商爭相進(jìn)場
做數(shù)據(jù)閉環(huán),一個代表是新能源車的龍頭、智駕起步較晚的比亞迪。
2023年中,比亞迪智駕負(fù)責(zé)人韓冰公布了一組數(shù)據(jù),「目前已形成一支300多輛車的研發(fā)車隊,已經(jīng)積累150PB以上的數(shù)據(jù),且每天新增數(shù)據(jù)1PB?!惯@一信息表明,比亞迪正處于「數(shù)據(jù)閉環(huán)」的啟動階段。
數(shù)據(jù)閉環(huán)分為兩種,一種是靠研發(fā)采集車。小鵬、華為在起步階段,均是靠這種方式獲取數(shù)據(jù)。另一種是通過量產(chǎn)車獲取數(shù)據(jù),這是在數(shù)據(jù)規(guī)模上來后的主流方式。
比亞迪采取前一種方式。
「1PB除以300輛車,意味著一輛車每天可以搜集3TB多的數(shù)據(jù),在行業(yè)中屬于正常水平。通過研發(fā)采集車收集數(shù)據(jù),是做數(shù)據(jù)閉環(huán)啟動階段的最好方式,也是必經(jīng)的方式。」李東旻告訴HiEV。
另一個代表,是最緊密跟隨特斯拉的小鵬汽車,也是業(yè)內(nèi)公認(rèn)的自動駕駛第一梯隊玩家。這家公司把數(shù)據(jù)閉環(huán)分為四個環(huán)節(jié):數(shù)據(jù)收集、標(biāo)注、訓(xùn)練和部署。
2022年1024科技日,小鵬披露在近10萬輛的小鵬車型上部署了超過300個觸發(fā)器,形成了一個「全閉環(huán)、自成長的AI和數(shù)據(jù)體系」。
數(shù)據(jù)閉環(huán)的魅力在于,當(dāng)這近10萬輛車形成了數(shù)據(jù)閉環(huán),就有了和特斯拉100萬輛車掰手腕的底氣。
原小鵬自動駕駛副總裁吳新宙曾表示,城市場景數(shù)據(jù)量并不是一個限制因素,只要可以閉環(huán),由10萬輛提供數(shù)據(jù)已經(jīng)足夠,一百輛車和一萬輛有非常大的差別,但10萬輛和100萬輛的差別不會太大。
如今,小鵬的自動駕駛進(jìn)展放在車企中妥妥地第一梯隊,其數(shù)據(jù)閉環(huán)能力自然也水漲船高,位居前列。如何評價數(shù)據(jù)閉環(huán)的水平高低,李東旻給了我們?nèi)齻€指標(biāo):
有效回傳的量有多大;
不是賣的車越多,數(shù)據(jù)回傳的量就越大。過去很多車受制于電子電氣架構(gòu),回傳能力相對欠缺。而那些基于域控架構(gòu)的車,數(shù)據(jù)閉環(huán)的質(zhì)量會高出很多。
OTA的能力有多強;
在數(shù)據(jù)閉環(huán)中,OTA的頻率越高,進(jìn)化速度越快,也意味著數(shù)據(jù)閉環(huán)的能力越強。
城市NOA開城數(shù)量;
數(shù)據(jù)閉環(huán)最終是服務(wù)于車輛的智駕功能,從數(shù)據(jù)閉環(huán)的結(jié)果看,城市NOA的城市數(shù)量越多,意味著數(shù)據(jù)閉環(huán)的能力越強。
目前,比較難以精準(zhǔn)統(tǒng)計小鵬的數(shù)據(jù)回傳規(guī)模和OTA頻次,只能從城市NOA這一維度來側(cè)面得出結(jié)論,隨著小鵬Xmart OS 4.4.0的推送,在無圖城市NOA這項比拼中,這家公司的數(shù)據(jù)閉環(huán)能力已經(jīng)占據(jù)頭號位。
比亞迪、小鵬之外,還有一類較早看清趨勢的供應(yīng)商,比如李東旻所在的覺非科技,從公司成立第一天起,就是瞄準(zhǔn)數(shù)據(jù)閉環(huán)而來。
據(jù)HiEV了解,以李東旻為主導(dǎo)的覺非科技的管理團隊,過去曾打造了用戶量過億的導(dǎo)航軟件,而導(dǎo)航軟件就是一個典型的數(shù)據(jù)閉環(huán)案例。從低頻逐漸變?yōu)楦哳l,尤其是引入了實時路況這樣的大數(shù)據(jù)之后,不斷地與導(dǎo)航軟件之間形成循環(huán)流動。
覺非的數(shù)據(jù)閉環(huán)架構(gòu),包含車端的感知、地圖引擎、感知定位,以及制圖工具鏈、輕地圖等,通過數(shù)據(jù)反饋、OTA/API的方式完成整個閉環(huán)。
這套數(shù)據(jù)閉環(huán)流程中還融合了三類系統(tǒng):
車的眼睛:攝像頭、激光雷達(dá)、毫米波雷達(dá)、4D毫米波雷達(dá);
車的小腦:位置姿態(tài)、RTK、差分定位、輪速、慣性導(dǎo)航;
記憶系統(tǒng):地圖引擎、記憶泊車、記憶行車;
主機廠想要采用覺非科技的數(shù)據(jù)閉環(huán)方案,大致有兩種方式:一種是搭載覺非基于地平線、英偉達(dá)芯片打造的數(shù)據(jù)閉環(huán)方案;另一種是搭載其研發(fā)的域控制器。
近日,覺非科技宣布已與多家頭部主機廠達(dá)成量產(chǎn)定點合作,圍繞輕地圖與數(shù)據(jù)閉環(huán)服務(wù)的量產(chǎn)車型將在今年正式交付。據(jù)HiEV了解,此次合作的頭部主機廠中,就有新能源車的銷量巨頭。
小鵬和覺非科技,代表了數(shù)據(jù)閉環(huán)的兩類玩家,那些尚未建立「數(shù)據(jù)閉環(huán)」能力的車企,無論學(xué)小鵬,還是與覺非科技這樣的公司合作,都需要正視數(shù)據(jù)閉環(huán),明白這項能力究竟在比拼什么。
「數(shù)據(jù)閉環(huán)」拼的是流程和工程化
數(shù)據(jù)閉環(huán),本質(zhì)是由數(shù)據(jù)去訓(xùn)練軟件算法,推動軟件算法不斷優(yōu)化升級的過程。
早期,自動駕駛開發(fā)者讓數(shù)據(jù)訓(xùn)練感知、規(guī)控等小模型,同步還延展至云端訓(xùn)練大模型,更加注重「數(shù)據(jù)」驅(qū)動。隨著數(shù)據(jù)規(guī)模的不斷增加,行業(yè)如今更加注重的「閉環(huán)」,數(shù)據(jù)的消費方又是數(shù)據(jù)的生產(chǎn)方。
前文介紹了比亞迪通過研發(fā)采集車獲取數(shù)據(jù)的方式,這種方式的好處是數(shù)據(jù)密度、數(shù)據(jù)質(zhì)量都很高。
以研發(fā)采集車為例,一輛車每天采集的數(shù)據(jù),大概在2T到4T之間。單個攝像頭一秒鐘能采集20-30M的數(shù)據(jù),10V的方案,一秒鐘采集300M,一天有效采集8小時的話,300臺車獲取的將是PB級別的數(shù)據(jù)。
但是上述方法對數(shù)據(jù)覆蓋率的問題是無法解決的,數(shù)據(jù)閉環(huán)真正的比拼其實要靠量產(chǎn)車。
前不久,蔚來汽車公開了一組數(shù)據(jù),10000輛蔚來汽車的軌跡,基本上把全上海進(jìn)行了覆蓋。蔚來提出了一個叫「群體智能」的新詞。群體智能的背后,是靠量產(chǎn)車實現(xiàn)了數(shù)據(jù)閉環(huán)。
與研發(fā)采集車不同,量產(chǎn)車的數(shù)據(jù)閉環(huán),不再是把硬盤卸下來,將數(shù)據(jù)拷出去,而是要在量產(chǎn)車上,通過一個安全合規(guī)的通道,然后上傳到云端,來完成數(shù)據(jù)的存儲、分發(fā)、訓(xùn)練,處理完之后再通過OTA的方式下發(fā)到量產(chǎn)車上。
量產(chǎn)車的優(yōu)勢在于覆蓋比較廣,難點在于,閉環(huán)的流程和工程化,而工程化,其實正是覺非科技這類本土自動駕駛公司所具備的優(yōu)勢。
據(jù)李東旻介紹,覺非科技在算法層面具備工程化壁壘,從早期的激光雷達(dá)方案,到后來的純視覺方案,覺非科技通過提供多傳感器融合計算的量產(chǎn)交付,以及將自家的軟件解決方案提供給主機廠做智能駕駛域控,目前已實現(xiàn)了對多個主機廠多款車型的定點交付,并計劃在今年繼續(xù)擴大合作范圍。
2023年其實有一個很明顯的現(xiàn)象,搭載高階智駕的車陡然增多。在這年的廣州車展上,幾款新發(fā)布的明星新能源車上,基本上標(biāo)配激光雷達(dá)、大算力芯片和全場景智能駕駛。
這些帶有大算力的高階智駕車型滲透率提升,會讓自車產(chǎn)生大量的數(shù)據(jù),也就是讓車企成為數(shù)據(jù)閉環(huán)的生產(chǎn)方,同時也是數(shù)據(jù)的消費方,車企們今天已經(jīng)抵達(dá)「數(shù)據(jù)閉環(huán)」舞臺中心。
作為消費者,看到的是城市NOA,具備城市NOA功能,將會極大地影響消費者的購買決策。
作為自動駕駛從業(yè)者,會發(fā)現(xiàn)實現(xiàn)城市NOA的唯一路徑便是數(shù)據(jù)閉環(huán),在「華山一條路上」,可以慢,可以錯,但唯獨不能不上山,否則就會被遺忘在山腳下。