作者 | 章漣漪
今年下半年,圖森未來會(huì)發(fā)布一個(gè)“數(shù)據(jù)集”,至少是百小時(shí)級(jí)別的、干凈的。
如何做負(fù)責(zé)任的自動(dòng)駕駛。
7月27日,首屆AI DAY上,自動(dòng)駕駛卡車公司圖森未來主要就講了這一件事。
在圖森未來CTO王乃巖看來,過去3至4年里,輔助駕駛系統(tǒng)在乘用車領(lǐng)域飛速發(fā)展,功能不斷增加,但依然是L2級(jí)輔助駕駛產(chǎn)品,無法突破至L3,乃至L4級(jí)自動(dòng)駕駛。
“這其中很大原因在于,L3和L4從功能上來說可能并不比L2更復(fù)雜,但可靠性上是質(zhì)的飛躍,因此輔助駕駛產(chǎn)品開發(fā)方法論,不適用于L3級(jí)及以上產(chǎn)品”。王乃巖表示,圖森未來基于更高階自動(dòng)駕駛設(shè)計(jì)了一整套全冗余架構(gòu)。
那么,圖森未來自動(dòng)駕駛系統(tǒng)方案具體如何設(shè)計(jì)?從技術(shù)研發(fā)到大規(guī)模量產(chǎn)落地還需要多久?
01、從車輛到算法,全冗余架構(gòu)解讀
全冗余,這是圖森未來L4級(jí)自動(dòng)駕駛系統(tǒng)的最大特點(diǎn)之一。
根據(jù)王乃巖介紹,圖森未來設(shè)計(jì)了一套全冗余的架構(gòu),包括了最底層車輛,到上層系統(tǒng)、傳感器,以及最上層算法模塊。
車輛方面,圖森未來使用車輛配備了冗余的轉(zhuǎn)向系統(tǒng)和制動(dòng)系統(tǒng),來保證出現(xiàn)單路失效狀況時(shí),車輛仍然能夠在其控制之下。
實(shí)現(xiàn)方式是,在系統(tǒng)設(shè)計(jì)層面,圖森未來設(shè)定了兩套完全獨(dú)立的系統(tǒng),即主系統(tǒng)和備系統(tǒng)。其中主系統(tǒng)L4駕駛的“主力”,使用的是高算力平臺(tái)和全套傳感器,可以實(shí)現(xiàn)完整的L4駕駛的功能。
與此同時(shí),圖森未來還配置了與之完全獨(dú)立的備系統(tǒng),其使用了低算力,但可靠性很高的車規(guī)級(jí)芯片和比較有限的傳感器。備系統(tǒng)只需要完成在主系統(tǒng)失效時(shí)候的降級(jí)功能。
兩套系統(tǒng)都實(shí)現(xiàn)了完全獨(dú)立的供電,可減少因?yàn)楣?a class="article-link" target="_blank" href="/baike/1465685.html">電導(dǎo)致供電故障的可能,進(jìn)一步提升了系統(tǒng)的可靠性。
在系統(tǒng)運(yùn)行模式方面,除了正常的L4級(jí)別自動(dòng)駕駛外,圖森未來還設(shè)計(jì)了兩種最小風(fēng)險(xiǎn)狀態(tài),分別是車輛側(cè)后方感知及轉(zhuǎn)向系統(tǒng)可用時(shí),可以實(shí)現(xiàn)應(yīng)急車道靠邊停車;在一些非常極端情況下,比如說徹底失去了后向和側(cè)向感知時(shí),設(shè)計(jì)了相應(yīng)的在當(dāng)前車道安全剎停等待救援模式。
傳感器冗余方面,圖森未來設(shè)計(jì)原則是使用全波段的電磁波感知,使用了相機(jī)、激光雷達(dá)和毫米波雷達(dá)三種傳感器,基于他們不同的特點(diǎn)和優(yōu)劣勢(shì),圖森未來設(shè)計(jì)了一套使用全類型傳感器、高可靠冗余方案。
算法冗余是圖森未來非常關(guān)注的領(lǐng)域。王乃巖稱,算法設(shè)計(jì)中最關(guān)鍵的點(diǎn)是如何處理失效問題。圖森未來在設(shè)計(jì)算法架構(gòu)時(shí)最核心的思想是:假設(shè)沒有一個(gè)傳感器是永遠(yuǎn)可靠的,沒有一個(gè)算法不會(huì)犯錯(cuò)。
基于這樣的一個(gè)想法,圖森未來車上運(yùn)行的算法分成了兩大類:Data-Driven算法和Principle-Based算法。前者為數(shù)據(jù)驅(qū)動(dòng)算法,它的原理是使用大模型驅(qū)動(dòng)AI算法,來實(shí)現(xiàn)像物體識(shí)別、車輛識(shí)別,以及包括動(dòng)態(tài)道路的環(huán)境感知等;后者的特點(diǎn)是能夠?qū)栴}和過程進(jìn)行精確建模。
王乃巖展開介紹稱,算法架構(gòu)設(shè)計(jì)的第一個(gè)模塊是感知模塊,這是冗余設(shè)計(jì)最困難的模塊,因?yàn)樵谠撃K中,圖森未來大量使用了數(shù)據(jù)驅(qū)動(dòng)算法。
基于此,圖森未來在感知模塊實(shí)現(xiàn)了三重冗余。一方面,其把三種感知方法分為兩大類:基于識(shí)別的物體感知和基于場(chǎng)景的障礙物感知。由于兩者原理不同、假設(shè)不同,這就意味著圖森未來已經(jīng)實(shí)現(xiàn)了一套冗余。
與此同時(shí),在基于識(shí)別的物體感知中,又使用了兩套完全獨(dú)立的系統(tǒng)去分別使用激光雷達(dá)和相機(jī)在第一階段生成候選框和候選物體,這兩套傳感器及算法都是完全獨(dú)立的。
在基于場(chǎng)景的障礙物感知方面,使用的也是層次化或者說漏斗式設(shè)計(jì)方案,去逐層提高識(shí)別準(zhǔn)確率,其中最底層,圖森未來基于激光雷達(dá)幾何性很強(qiáng)的特征,去初篩所有可能存在的通用障礙物,在此之上使用高精度地圖和相機(jī),去實(shí)現(xiàn)準(zhǔn)確率的逐步提升,以滿足下游規(guī)控算法需求。
這兩套系統(tǒng)一起提升了整個(gè)感知模塊的冗余程度。
除了冗余挑戰(zhàn)之外,卡車場(chǎng)景還有一個(gè)天然的挑戰(zhàn):遠(yuǎn)距離感知。由于卡車的載重、車身長(zhǎng)度等因素,導(dǎo)致其相比于乘用車需要更長(zhǎng)的緊急剎停距離和完整變道距離,這對(duì)算法的性能和可靠性都提出了很大的挑戰(zhàn)。王乃巖稱,根據(jù)其經(jīng)驗(yàn),卡車的車道感知距離最好是400米至500米,乃至更遠(yuǎn)距離。
02、從感知到產(chǎn)品,實(shí)踐經(jīng)驗(yàn)分享
在王乃巖演講過程中,不斷有圖森未來技術(shù)專家基于實(shí)踐,針對(duì)感知模塊、定位模塊、預(yù)測(cè)規(guī)劃和控制、端到端仿真、數(shù)據(jù)自動(dòng)標(biāo)注和產(chǎn)品六個(gè)方面進(jìn)行了分享。
感知模塊方面,正如前面所言,圖森未來L4級(jí)自動(dòng)駕駛方案需要做到感知算法的冗余,這要求視覺能夠獨(dú)立感知周圍環(huán)境。以3D目標(biāo)檢測(cè)為例,其所要做的是,通過環(huán)視攝像頭來獲取物體在3D空間下的大小位置和姿態(tài)信息。
目前主流3D目標(biāo)檢測(cè)的方式是BEV方法。但如果直接應(yīng)用到場(chǎng)景中,會(huì)遇到兩個(gè)問題:一是長(zhǎng)距離感知需要構(gòu)建長(zhǎng)距離BEV空間,這會(huì)消耗大量的計(jì)算和空間資源;二是算法設(shè)計(jì)沒有考慮到相機(jī)之間互補(bǔ)冗余,如果出現(xiàn)漏檢,會(huì)造成整個(gè)系統(tǒng)消失。
針對(duì)上述兩大問題,圖森未來給出的方法是:基于物體多視覺的3D檢測(cè)框架,在環(huán)視鏡頭輸入后,會(huì)對(duì)每個(gè)相機(jī)進(jìn)行2D檢測(cè),并融合各視角信息,最終形成3D檢測(cè)結(jié)果。在實(shí)現(xiàn)相對(duì)魯棒的同時(shí),也能保證算法內(nèi)部的冗余。
定位模塊方面,作為無人駕駛汽車模塊中非常重要部分,它對(duì)于可靠性的要求比感知模塊更高。畢竟如果在300米范圍內(nèi)漏檢了一輛車,可能不會(huì)立即導(dǎo)致事故,但如果定位算法偏差超過半米可能直接沖出車道,碰撞障礙物。
因此,在定位算法里,對(duì)于精度和魯棒性的要求遠(yuǎn)高于其他模塊。基于此,圖森未來選擇了多傳感器融合方案,包括相機(jī)、激光雷達(dá)和組合導(dǎo)航。
預(yù)測(cè)規(guī)劃和控制模塊方面,圖森未來稱,由于卡車不是單體結(jié)構(gòu),而是由兩部分組成,會(huì)導(dǎo)致出現(xiàn)非常復(fù)雜的動(dòng)力學(xué)和運(yùn)動(dòng)學(xué)模型;同時(shí),因重量和尺寸原因,卡車只有非常有限的加減速性能。
為應(yīng)對(duì)上述挑戰(zhàn),業(yè)界流行做法是,將對(duì)其他車輛預(yù)測(cè)、自車決策、自車控制,以及自車軌跡橫向和縱向規(guī)劃五個(gè)部分分別取優(yōu)化,這樣的好處是整個(gè)系統(tǒng)比較可控,且每個(gè)模塊可以獨(dú)立完成自己目標(biāo),但劣勢(shì)是分塊的系統(tǒng)難以去實(shí)現(xiàn)統(tǒng)一優(yōu)化目標(biāo)服務(wù)于一輛車。
業(yè)界第二代的做法是實(shí)現(xiàn)橫縱聯(lián)合規(guī)劃,即把整個(gè)橫向規(guī)劃和縱向規(guī)劃耦合在一起,變成同樣一個(gè)模塊。而圖森的做法是“一步到位”,實(shí)現(xiàn)五個(gè)部分的聯(lián)合優(yōu)化,實(shí)現(xiàn)預(yù)測(cè)為決策服務(wù)。
端到端仿真模塊,常見的仿真是做規(guī)控的仿真,在規(guī)控仿真中只運(yùn)行規(guī)控模塊和底層車輛模型,它對(duì)于低級(jí)別自動(dòng)駕駛系統(tǒng)可行,但圖森未來的感知系統(tǒng)及規(guī)控系統(tǒng)間有非常復(fù)雜的耦合關(guān)系,簡(jiǎn)單的仿真測(cè)試不足以滿足。
為此,圖森未來在仿真測(cè)試中采用到了端到端的仿真測(cè)試框架,將整個(gè)算法系統(tǒng)作為黑盒進(jìn)行測(cè)試,實(shí)現(xiàn)更高級(jí)別的集成測(cè)試,也是HIL測(cè)試的基礎(chǔ)。
仿真測(cè)試系統(tǒng)是怎么構(gòu)成的呢?首先,它是一個(gè)離線閉環(huán)系統(tǒng),目的是測(cè)試我們整套算法系統(tǒng),同時(shí)也支持多場(chǎng)景測(cè)試,包括真實(shí)場(chǎng)景導(dǎo)入仿真場(chǎng)景庫后測(cè)試和人工編輯長(zhǎng)尾問題測(cè)試。
在工程上,端到端仿真系統(tǒng)架構(gòu)主要分為兩部分:有仿真引擎及仿真底層物理世界引擎和車輛動(dòng)力學(xué)模型構(gòu)成的仿真系統(tǒng);另一部分是由運(yùn)行整套算法自駕的域控,以及一些虛擬車輛控制單元組成的測(cè)試環(huán)境。兩套系統(tǒng)通過傳感器的輸出,以及一些看的消息進(jìn)行通訊。可以通過回放路測(cè)場(chǎng)景和虛擬引擎渲染方案實(shí)現(xiàn),但兩者都存有一些弊端。
為此,圖森未來采用了神經(jīng)渲染的方法。即,基于錄采數(shù)據(jù)重建3D場(chǎng)景,并在相機(jī)中渲染出來,而對(duì)于路上遇到的各種交通參與物,只需要傳感器掃到他們,再離線通過一套處理將其加入仿真場(chǎng)景庫。
據(jù)介紹,圖森未來循環(huán)運(yùn)行所有的離線仿真場(chǎng)景只需要不到30分鐘,每小時(shí)運(yùn)行成本小于10元。
此外,數(shù)據(jù)自動(dòng)標(biāo)注模塊,圖森未來的核心思想是在一個(gè)序列里面,一旦檢測(cè)到一幀會(huì)使用跟蹤算法,把整個(gè)序列上的物體關(guān)于它的點(diǎn)源全部找到,然后堆疊起來,以保證比較高的效率;產(chǎn)品模塊,圖森未來的主要工作是用戶研究和需求挖掘、需求定義、需求驗(yàn)收和ODD定義。
03、實(shí)現(xiàn)自動(dòng)駕駛數(shù)據(jù)很重要,下半年會(huì)分享數(shù)據(jù)集
在詳細(xì)介紹完技術(shù)情況后,圖森未來還組織了一場(chǎng)圓桌論壇,去談?wù)搹南薅▍^(qū)域自動(dòng)駕駛到全場(chǎng)景L5級(jí)別自動(dòng)駕駛需要多久。
上海人工智能實(shí)驗(yàn)室青年科學(xué)家李弘揚(yáng)指出,作為學(xué)術(shù)界,“如何實(shí)現(xiàn)L4、L5級(jí)自動(dòng)駕駛”是他們非常關(guān)心的問題。其中,大模型是非常重要的技術(shù)。
至于“什么是大模型”,李弘揚(yáng)也坦言,怎么定義其實(shí)大家都沒有想得很清楚。但可以換個(gè)方式思考,大模型應(yīng)該是什么樣子。在他看來,它應(yīng)該是個(gè)感知、決策相關(guān)的,追求自動(dòng)駕駛穩(wěn)定、安全、可靠的。從這個(gè)角度思考,大模型至少需要有預(yù)測(cè)環(huán)節(jié)的能力,這背后需要海量數(shù)據(jù)的支持。
“每家車企都在說自己有海量數(shù)據(jù),但這其實(shí)和我們關(guān)系不大,我們要的是公開演講,需要能夠爬到的數(shù)據(jù)”。李弘揚(yáng)稱,但如果沒有海量、高質(zhì)量的數(shù)據(jù),無法實(shí)現(xiàn)大模型。這意味著,想要實(shí)現(xiàn)L4、L5級(jí)自動(dòng)駕駛,需要先建立擁有海量數(shù)據(jù)的自動(dòng)駕駛大模型。
對(duì)于李弘揚(yáng)的觀點(diǎn),復(fù)旦大學(xué)工廠與應(yīng)用技術(shù)研究院青年研究員丁文超部分認(rèn)同。他也認(rèn)為,自動(dòng)駕駛實(shí)現(xiàn)需要海量數(shù)據(jù)。但車企并非不愿意開放數(shù)據(jù),而是不知道怎么處理。所以,如何把數(shù)據(jù)規(guī)整出來,比如時(shí)間戳標(biāo)定同步,是當(dāng)下需要解決的問題,這也是制約真正的自動(dòng)駕駛大模型建立、實(shí)現(xiàn)的因素。
“關(guān)于數(shù)據(jù),主機(jī)廠一直希望能夠得到咱們的訴求,或者說一起合作去做一些事情?!备L锲?a class="article-link" target="_blank" href="/tag/%E6%99%BA%E8%83%BD%E9%A9%BE%E9%A9%B6/">智能駕駛研究中心副主任金大鵬也表示,愿意支持學(xué)界、自動(dòng)駕駛公司去做更多數(shù)據(jù)的工作?!?strong>我們有大量的需求和數(shù)據(jù),能夠給到學(xué)術(shù)界和自動(dòng)駕駛公司使用,以持續(xù)迭代?!?/p>
同時(shí),他也就主機(jī)廠的需求進(jìn)行了探討。他指出,這些年主機(jī)廠也有了思想轉(zhuǎn)換,大家更多的不去想L3、L4、L5的問題,而是思考如何滿足客戶的需求,當(dāng)然是在符合法規(guī)的前提下。比如,用戶需要降低長(zhǎng)距離行駛疲勞、降低司機(jī)成本。作為主機(jī)廠就會(huì)優(yōu)先考慮怎么解決這些訴求,而不是局限在級(jí)別定義里。
對(duì)于上述嘉賓們提到的問題,王乃巖深表認(rèn)同。他認(rèn)為,數(shù)據(jù)問題確實(shí)是當(dāng)下非常大的挑戰(zhàn),特別是在數(shù)據(jù)清洗這一塊,不止學(xué)術(shù)界,企業(yè)內(nèi)部也面臨這樣的問題。
不過,在活動(dòng)最后,王乃巖放出彩蛋表示,今年下半年,圖森未來計(jì)劃發(fā)布一個(gè)“數(shù)據(jù)集”,可能沒有上千小時(shí)那么大,但是至少是百小時(shí)級(jí)別的,并且很干凈,會(huì)是完整環(huán)視的、多視覺的,包括商用車、甚至乘用車,給學(xué)術(shù)界使用。
此次AI DAY,是圖森未來宣布業(yè)務(wù)優(yōu)化后首次對(duì)外正式活動(dòng)。今年5月中旬,圖森未來宣布業(yè)務(wù)重組計(jì)劃,會(huì)減少美國(guó)業(yè)務(wù),進(jìn)一步擴(kuò)招中國(guó)團(tuán)隊(duì);6月28日?qǐng)D森未來再發(fā)公告,稱正在探索美國(guó)業(yè)務(wù)的戰(zhàn)略替代方案,包括可能出售美國(guó)業(yè)務(wù),并更加重視亞太地區(qū)和全球其他主要市場(chǎng)。
一直以來,圖森未來被認(rèn)為是自動(dòng)駕駛卡車領(lǐng)域的“技術(shù)”擔(dān)當(dāng),此前因?yàn)閮?nèi)外部問題,一度陷入“混亂”。此次在上海舉辦AI DAY,為再次對(duì)外表達(dá)回歸技術(shù)、回歸中國(guó)的決心。