每次看到“幽靈剎車”上熱搜,記者首先想到的就是特斯拉。
原因很簡(jiǎn)單,長(zhǎng)期以來(lái),特斯拉的自動(dòng)駕駛方案采用純視覺(jué)方案,該方案有一個(gè)很大的缺點(diǎn),那就是很難判斷前方物體的具體形狀。激光雷達(dá)的探測(cè)方式不同于攝像頭,點(diǎn)云反射測(cè)距方法讓雷達(dá)方案可以很容易檢測(cè)到前方物體的具體形狀與深度,進(jìn)而快速判斷前方物體是“平面”還是“物塊”,可以很好的規(guī)避“幽靈剎車”發(fā)生。
然而最近理想也被爆出“幽靈剎車”事件。據(jù)網(wǎng)絡(luò)上流傳的一段視頻顯示,四川甘孜時(shí)先生在駕駛理想L7在路上正常行駛,突然車速?gòu)能囁偻蝗粡?0km/h快速降到20km/h左右,隨后直接剎停。
值得關(guān)注的一點(diǎn)在于,理想L7 Max版配備了激光雷達(dá),此外還有6個(gè)800萬(wàn)像素?cái)z像頭、5個(gè)200萬(wàn)像素?cái)z像頭、1 個(gè)前向毫米波雷達(dá)以及安全冗余系統(tǒng);Pro版則為1個(gè)800萬(wàn)像素?cái)z像頭、9個(gè)200萬(wàn)像素?cái)z像頭、1個(gè)前向毫米波雷達(dá)。
事件發(fā)酵后,理想官方對(duì)此事件回復(fù):“因?yàn)榧す饫走_(dá)把廣告牌上準(zhǔn)備起跑的人物,識(shí)別成了在路中間的真人,所以才緊急剎停?!焙髞?lái)理想售后客服又做出回應(yīng),稱激光雷達(dá)有一個(gè)視覺(jué)感知的效果,識(shí)別廣告牌剎停這種情況也要看當(dāng)時(shí)用車環(huán)境,具體原因需要工程師做分析診斷。其實(shí)在此之前,理想還發(fā)生過(guò)“墓地憑空出現(xiàn)大量人員”以及“車速140邁有人跟跑”事件(真的嚇人),官方都解釋為傳感器出現(xiàn)問(wèn)題。
從官方回復(fù)中得知,該款車型為搭載激光雷達(dá)的理想L7 MAX版,而激光雷達(dá)相比攝像頭的一項(xiàng)重要優(yōu)勢(shì)就是可以識(shí)別物體深度,也就是說(shuō),理想L7本應(yīng)該知道前方的是廣告牌而不是真人。
為什么用了激光雷達(dá)仍會(huì)“幽靈剎車”?激光雷達(dá)在與攝像頭協(xié)同工作的時(shí)候會(huì)出現(xiàn)哪些問(wèn)題?輔助駕駛還能用嗎?本文將帶你了解自動(dòng)駕駛傳感融合模式的差別,深挖激光雷達(dá)出現(xiàn)“失誤”的真正原因。
不同方案的傳感融合
挖掘理想“幽靈剎車”真相的第一步,我們先簡(jiǎn)單了解一下自動(dòng)駕駛方案的區(qū)別。
當(dāng)前,常見(jiàn)的自動(dòng)駕駛解決方案有三種:純視覺(jué)方案、毫米波雷達(dá)方案、激光雷達(dá)方案。其實(shí),它們本質(zhì)上的區(qū)別就是基于何種傳感器建立的識(shí)別體系。
攝像頭、激光雷達(dá)或毫米波雷達(dá)等感知傳感器在不同的環(huán)境場(chǎng)景下各有優(yōu)缺點(diǎn)。攝像頭提供了豐富的顏色和視覺(jué)信息,但缺乏提供深度信息。激光雷達(dá)給出物體的深度信息,但是非常稀疏,且沒(méi)有顏色信息。毫米波雷達(dá)不受光照影響,探測(cè)范圍遠(yuǎn),但與激光雷達(dá)相比,它的分辨率較低。因此不同傳感器在不同環(huán)境中的能力有較大差別。
圖源:自制
從對(duì)比中我們可以得出結(jié)論,激光雷達(dá)用于中程自動(dòng)駕駛汽車的高精度探測(cè)領(lǐng)域。攝像頭提供了更多視覺(jué)信息,但激光雷達(dá)和攝像頭都會(huì)受到惡劣天氣的影響。由于毫米波雷達(dá)能發(fā)射穿透雨霧的無(wú)線電磁波,因此它具有較大的探測(cè)范圍,還可以在惡劣的天氣條件下工作。激光雷達(dá)相比毫米波雷達(dá)具有更高的準(zhǔn)確度,但也有更高的成本。
因此,我們需要一種由激光雷達(dá)、毫米波雷達(dá)和攝像頭組成的車輛來(lái)應(yīng)對(duì)所有天氣情況。從車輛成本與性能平衡的角度出發(fā),我們應(yīng)該至少在激光雷達(dá)或毫米波雷達(dá)中二選一,再搭配攝像頭來(lái)完成自動(dòng)駕駛的探測(cè)任務(wù)。這時(shí)就需要用到傳感融合,然而傳感融合是一項(xiàng)十分復(fù)雜的技術(shù)或算法,不是簡(jiǎn)單的將兩者相加。
傳感融合,本質(zhì)上是數(shù)據(jù)融合。激光雷達(dá)與攝像頭的融合方式主要有兩種,即前期融合(Early Fusion)與后期融合(Late Fusion)。
在前期融合中,來(lái)自激光雷達(dá)的點(diǎn)云、毫米波雷達(dá)與相機(jī)的圖像,會(huì)在處理之前進(jìn)行融合。我們以激光雷達(dá)和攝像頭融合方案為例。首先通過(guò)齊次坐標(biāo)(投影空間坐標(biāo),具有N個(gè)維),加以一些平移旋轉(zhuǎn)等過(guò)程,將3D的激光雷達(dá)點(diǎn)云投影到2D的攝像頭圖像中,最終獲得外界物塊的歐幾里得坐標(biāo)(即在笛卡爾空前內(nèi)標(biāo)注,也就是我們中學(xué)學(xué)到的空間坐標(biāo)系)。隨后,系統(tǒng)會(huì)通過(guò)深度學(xué)習(xí)的方式識(shí)別標(biāo)注的物體。
在后期融合中,激光雷達(dá)、毫米波雷達(dá)與攝像頭會(huì)獨(dú)立獲得結(jié)果。首先激光雷達(dá)會(huì)獨(dú)立完成3D物體的圖像檢測(cè),然后系統(tǒng)會(huì)將攝像頭中得到的2D物體投影到3D空間中,再進(jìn)行匹配最終得到結(jié)果。
目前傳感融合仍舊面臨著許多問(wèn)題,例如遮擋、截?cái)唷h(huán)境的動(dòng)態(tài)分析等,而且還有相當(dāng)多的算法依賴物體表面問(wèn)題特征進(jìn)行判斷,這都非常容易造成混淆,進(jìn)而影響算法準(zhǔn)確率。
這里補(bǔ)充一點(diǎn),無(wú)人駕駛系統(tǒng)包括感知層、認(rèn)知層、決策層、控制層四種。傳感器探測(cè)外界信息并進(jìn)行融合,這些都屬于感知層。鑒于幾乎所有的廠商都面臨此類問(wèn)題,外加理想還有“前科”,因此記者認(rèn)為理想大概率是在后面的步驟出現(xiàn)問(wèn)題。
為什么會(huì)剎車?
目前市場(chǎng)上的多傳感器感知系統(tǒng)很大程度上依賴于后期傳感器融合,其中傳感器的輸出僅在對(duì)象級(jí)別組合。這意味著每個(gè)傳感器完全獨(dú)立運(yùn)行,所有未超過(guò)檢測(cè)閾值的低級(jí)信息都將被完全丟棄。
可能有的讀者會(huì)產(chǎn)生疑問(wèn),為什么我們要選擇保存信息量少的后期融合,而不是盡可能的在前期融合,來(lái)保證數(shù)據(jù)的準(zhǔn)確呢?事實(shí)上,有相當(dāng)多的文獻(xiàn)均表明越靠前期的傳感融合,它提供的目標(biāo)檢測(cè)越精確。但這里面臨一個(gè)問(wèn)題,某個(gè)傳感器可能會(huì)探測(cè)到其他傳感器無(wú)法探測(cè)到的物體,這種信息是無(wú)法在融合算法中進(jìn)行處理的。
首先,為了減少無(wú)法融合的物體數(shù)量,車輛就需要盡可能多的搭載傳感器(甚至需要多個(gè)激光雷達(dá)),這在成本上難以接受。其次,該類數(shù)據(jù)在硬件上很難進(jìn)行優(yōu)化。最后,整車廠采購(gòu)的傳感器往往來(lái)自不同的供應(yīng)商,這意味著大量傳感器的接口并不互通,建立統(tǒng)一的數(shù)據(jù)轉(zhuǎn)換平臺(tái)工程量很大。因此,后期傳感融合成為當(dāng)前的主流模式,這也間接造成了部分判斷的失誤。
無(wú)論是Early還是Late,傳感融合都需要結(jié)合物體識(shí)別步驟,也就是將數(shù)據(jù)導(dǎo)入認(rèn)知層,這時(shí)就要用到3D計(jì)算機(jī)視覺(jué)技術(shù)了。該技術(shù)的經(jīng)典方法則是利用統(tǒng)計(jì)學(xué)和概率學(xué)模型,在預(yù)先深度學(xué)習(xí)過(guò)大量數(shù)據(jù)后才能實(shí)現(xiàn)對(duì)物體的準(zhǔn)確識(shí)別。
目前基于卷積神經(jīng)網(wǎng)絡(luò) (CNN) 的模型分析被廣泛用于對(duì)象檢測(cè)和分類上。它可以簡(jiǎn)單的分成輸入、提取、優(yōu)化、分類、輸出、監(jiān)控(預(yù)測(cè))。首先,傳感融合得出的圖像數(shù)據(jù)會(huì)被提供給輸入層,然后卷積層會(huì)從圖像中提取出重要特征,并通過(guò)算法將重要信息保留同時(shí)剔除冗余信息來(lái)降低復(fù)雜度。最后,CNN中的所有神經(jīng)元會(huì)通過(guò)算法將物體分類進(jìn)行判斷,最終輸出。即最終輸出的結(jié)果,仍舊需要用分類概率產(chǎn)生,即讓算法“猜”出來(lái)。因此,這里可能會(huì)有算法判斷失誤的可能性。
關(guān)鍵的一點(diǎn)來(lái)了,CNN還具有對(duì)物體未來(lái)運(yùn)動(dòng)的預(yù)測(cè)功能,尤其在車輛高速行駛狀態(tài)下,對(duì)物體運(yùn)動(dòng)的提前預(yù)測(cè)可以幫助車輛留夠剎車距離。預(yù)測(cè)模塊的輸入依賴感知模塊的輸出,這些輸入內(nèi)容包括物體的位置、速度、朝向、物體分類(如車輛,行人,自行車)等信息。
從本次理想“幽靈剎車”爆出的視頻來(lái)看,廣告牌正好置于車道右前方,而車輛剛好處于高速行駛的時(shí)刻。此時(shí)在激光雷達(dá)的“眼”中,在忽略掉距離、形狀等問(wèn)題后,它向后端判斷層輸出的是:該物體正向車輛快速移動(dòng)。而攝像頭看到的,則是一個(gè)做起跑動(dòng)作的人在向汽車移動(dòng)。
所以,記者綜合以上內(nèi)容判斷:由于車輛采用后期融合的方案,激光雷達(dá)與攝像頭同時(shí)判斷這是一個(gè)快速向車輛移動(dòng)的物體,同時(shí)結(jié)果中還疊加了攝像頭對(duì)于人的判斷。因此,基于對(duì)外界物體未來(lái)移動(dòng)路徑的分析,理想L7 ADAS系統(tǒng)的決策層認(rèn)為此時(shí)應(yīng)該緊急剎車,來(lái)避免與前方大概率為 “人”的物體的碰撞。
應(yīng)該怎么避免?
綜合目前自動(dòng)駕駛的發(fā)展勢(shì)頭,杜絕“幽靈剎車”現(xiàn)象,可能不久就能實(shí)現(xiàn)。
在傳感融合層面,車廠應(yīng)該讓傳感器數(shù)據(jù)做到盡量前期融合,這樣在本次事件中,ADAS系統(tǒng)就能很容易判斷出來(lái),這是一個(gè)向汽車飛奔的廣告牌,而不是真實(shí)的人類。但這就要面臨前文提到的問(wèn)題,成本、優(yōu)化以及接口問(wèn)題。
成本。目前車載傳感器中,激光雷達(dá)是最貴的,而且遙遙領(lǐng)先其他任何一款傳感器。不過(guò)隨著目前國(guó)產(chǎn)激光雷達(dá)廠商發(fā)力,以及激光雷達(dá)大規(guī)模上車攤平成本,產(chǎn)品的價(jià)格已經(jīng)在飛速降低了。
2023年3月,禾賽科技2022 年第四季度財(cái)報(bào)披露,其四季度毛利率已從52.4%大幅下滑至30%,季度出貨量同比漲幅高達(dá)739%,禾賽在“虧本賺吆喝”的路上一去不復(fù)返。幾乎在同一時(shí)期,覽沃發(fā)布的業(yè)內(nèi)首款360°混合固態(tài)激光雷達(dá),將激光雷達(dá)價(jià)格壓到3999元。華為此前也高調(diào)宣稱,未來(lái)計(jì)劃將激光雷達(dá)成本降低至200美元,甚至是100美元。相信在不遠(yuǎn)的未來(lái),激光雷達(dá)相比其他傳感器的價(jià)格劣勢(shì)將會(huì)快速消失。當(dāng)然,在此之前激光雷達(dá)市場(chǎng)可能會(huì)經(jīng)歷一次嚴(yán)酷的“重新洗牌”。
優(yōu)化。更多的傳感器,更前期的融合,就需要芯片處理更大的數(shù)據(jù)量,也就需要更大的算力。最近英偉達(dá)市值一度沖破1萬(wàn)億美元。從業(yè)務(wù)上看,它的成功其實(shí)在于壓中兩大風(fēng)口,一個(gè)是AI,另一個(gè)則是自動(dòng)駕駛。英偉達(dá)本季度汽車板塊收入達(dá)到2.96億美元。其中英偉達(dá)2019年推出了DRIVE AGX Orin平臺(tái),據(jù)官方消息比亞迪新車將采用該芯片。Orin最高算力達(dá)到2000TOPS,能夠覆蓋從L2到L5自動(dòng)駕駛?cè)珗?chǎng)景。因此,基于自動(dòng)駕駛芯片算力的高速增長(zhǎng),數(shù)據(jù)優(yōu)化也將不再是問(wèn)題。
接口,或者說(shuō)是整合。最近幾年,中國(guó)電動(dòng)汽車產(chǎn)業(yè)飛速發(fā)展,在新能源汽車領(lǐng)域已經(jīng)成為名副其實(shí)的世界第一強(qiáng)國(guó)。但快速進(jìn)化的技術(shù)也造成產(chǎn)業(yè)鏈的大調(diào)整,這也導(dǎo)致汽車主機(jī)廠商的話語(yǔ)權(quán)不斷增大,很多曾經(jīng)的Tier2、Tier3廠商都與主機(jī)廠建立聯(lián)系。因此,在未來(lái)或許可以看到較為強(qiáng)勢(shì)的廠商能夠整合產(chǎn)業(yè)鏈,開(kāi)發(fā)統(tǒng)一的數(shù)據(jù)交換接口,從而降低床傳感融合的難度。
綜上,避免 “幽靈剎車”出現(xiàn),車廠應(yīng)在傳感融合上發(fā)力,采用前期融合技術(shù)來(lái)提升判斷精確度。
寫(xiě)在最后
盡管理想的"幽靈剎車"事件引發(fā)了人們對(duì)輔助駕駛技術(shù)的擔(dān)憂,但我們可以對(duì)未來(lái)的發(fā)展保持樂(lè)觀態(tài)度。這次事件的根本原因在于傳感融合技術(shù)的缺陷,而隨著半導(dǎo)體行業(yè)不斷推進(jìn)技術(shù)的發(fā)展,這些缺陷很快將得到解決。同時(shí),業(yè)內(nèi)對(duì)于安全性和可靠性的關(guān)注也在不斷增加,廠商們正在采取各種措施來(lái)確保他們的產(chǎn)品符合高標(biāo)準(zhǔn)的質(zhì)量和可靠性要求。
綜上所述,雖然理想的"幽靈剎車"事件給人們帶來(lái)了擔(dān)憂,但我們應(yīng)該對(duì)輔助駕駛技術(shù)的未來(lái)保持信心。