2022行至年終,各種年度總結(jié)也紛至沓來。要說最近的大事件,一定少不了:自動(dòng)駕駛又雙叒寒冬了。
大量“報(bào)憂不報(bào)喜”的新聞,說明2022年自動(dòng)駕駛行業(yè)確實(shí)出現(xiàn)了一定程度的波動(dòng):激光雷達(dá)鼻祖德國ibeo和獨(dú)角獸Argo.ai相繼破產(chǎn);不少自動(dòng)駕駛公司傳出裁員和組織架構(gòu)調(diào)整,Waymo的估值大幅下跌,起火撞車等負(fù)面輿論不斷……這些事件都引發(fā)了悲觀情緒,讓“寒冬說”顯得有理有據(jù)。
但如果我們?nèi)プ屑?xì)探究就會(huì)發(fā)現(xiàn):第一,人工智能永遠(yuǎn)是在泡沫和寒冬中振蕩,自動(dòng)駕駛寒冬的論調(diào)其實(shí)早在幾年前就出現(xiàn)了,但主機(jī)廠、科技企業(yè)、資本市場對(duì)自動(dòng)駕駛的投入并沒有冰封,參與者眾多;第二,調(diào)整和波動(dòng)也不一定就意味著悲觀,寒冬期往往也是優(yōu)勝劣汰,比如此次調(diào)整后很多廠商都將目光轉(zhuǎn)向了L2級(jí)別的輔助駕駛技術(shù),大浪淘沙始見金,這正是具有領(lǐng)先技術(shù)優(yōu)勢的AI公司展露生命力的時(shí)機(jī)。
更進(jìn)一步,中美公司作為自動(dòng)駕駛領(lǐng)域中AI技術(shù)的頭部選手,其所面臨的背景和挑戰(zhàn)實(shí)際上也有差異,中國自動(dòng)駕駛企業(yè)接下來走向何處,恐怕不能簡單地依靠海外獨(dú)角獸的境遇來判斷。
所以,我們需要拋開情緒,回歸事實(shí),去對(duì)比一下,中美在自動(dòng)駕駛技術(shù)模式上究竟有哪些異與同,開往春天的自動(dòng)駕駛又需要穿越哪些障礙?
目前,以國外的特斯拉、國內(nèi)的毫末智行等為代表的漸進(jìn)式自動(dòng)駕駛公司,都已經(jīng)實(shí)現(xiàn)了乘用車輔助駕駛產(chǎn)品規(guī)模量產(chǎn)和商業(yè)化落地。前不久,毫末智行和特斯拉也相繼舉辦了第六屆HAOMO AI DAY、2022Tesla AI Day,公布了各自的最新產(chǎn)品和技術(shù)成果。
近日,毫末在其三周年內(nèi)部信中新發(fā)布了其愿景“讓機(jī)器智能移動(dòng),給生活更多美好”,這其實(shí)也透露出一個(gè)信號(hào),那就是自動(dòng)駕駛AI技術(shù)其實(shí)可以廣泛復(fù)用在各種場景的機(jī)器人上。因此,自動(dòng)駕駛的前景不言自明,所以,最終的關(guān)鍵就在于自動(dòng)駕駛技術(shù)是否能抵達(dá)規(guī)模落地的終局?
深入對(duì)比兩家在自動(dòng)駕駛AI技術(shù)的探索,我們可以發(fā)現(xiàn),兩家正在積極擁抱以大數(shù)據(jù)、大算力、大模型為標(biāo)志的自動(dòng)駕駛3.0時(shí)代,同時(shí)在技術(shù)及產(chǎn)品等多個(gè)方面,也展現(xiàn)出中美自動(dòng)駕駛發(fā)展模式的一些異同。
我們用一張圖進(jìn)行簡單對(duì)比:
可以看到,自動(dòng)駕駛行業(yè)正在迎來一個(gè)深刻的產(chǎn)業(yè)之變,如何穿越寒冬、鞏固王城,我們可以從這兩家企業(yè)的技術(shù)探索的步履中找到線索。
高階自動(dòng)駕駛“降維”與智能輔助駕駛“升級(jí)”同時(shí)進(jìn)行
無論媒體、企業(yè)還是大眾,可能都被這一場突如其來的自動(dòng)駕駛“寒冬”風(fēng)波驚嚇得不輕。但平靜下來,會(huì)發(fā)現(xiàn)這場風(fēng)波其實(shí)早有征兆。
一方面,L4及以上的自動(dòng)駕駛技術(shù)非常困難,道路漫長,技術(shù)前景模糊,2019年初,時(shí)任Waymo首席執(zhí)行官約翰·克拉夫奇克就曾公開表示“自動(dòng)駕駛汽車可能永遠(yuǎn)無法在全路況條件下行駛”,算是預(yù)言了這場高階自動(dòng)駕駛技術(shù)的“寒冬”。
另一方面,商業(yè)化落地遙遙無期,讓投入巨大的自動(dòng)駕駛公司很難在短期內(nèi)實(shí)現(xiàn)盈利,去年頭豹研究院發(fā)布的一份研報(bào)就認(rèn)為,Robotaxi模式是處在“偽概念”階段,相關(guān)公司仍深陷“量產(chǎn)地獄”。
客觀來說,對(duì)于高階自動(dòng)駕駛的質(zhì)疑早已非一日之寒,而大量高階自動(dòng)駕駛的企業(yè)也開始主動(dòng)“降維”,發(fā)力輔助駕駛。傳統(tǒng)主機(jī)廠如福特和大眾停止Argo AI的投入之后,轉(zhuǎn)而集中資源做L2+高級(jí)駕駛輔助系統(tǒng)和L3自動(dòng)駕駛系統(tǒng)的開發(fā)。一批優(yōu)秀的L2級(jí)別自動(dòng)駕駛相關(guān)企業(yè)開始蠶食傳統(tǒng)博世、大陸、奧托立夫等公司的份額。而博世也投資了文遠(yuǎn)知行以展開乘用車的L2-L3級(jí)自動(dòng)駕駛軟件開發(fā)。
近年來,智能輔助駕駛與特定場景下的高階自動(dòng)駕駛商用車,展現(xiàn)出較強(qiáng)的商業(yè)化前景。特斯拉、毫末智行等都已實(shí)現(xiàn)了規(guī)模化量產(chǎn),市場正在加速打開。
隨著更多競爭者的加入,以及AI技術(shù)的發(fā)展,自動(dòng)駕駛正在進(jìn)入以大數(shù)據(jù)、大算力、大模型為標(biāo)志的新時(shí)代,智能輔助駕駛也開始沿著以數(shù)據(jù)驅(qū)動(dòng)的大數(shù)據(jù)、大模型技術(shù)路線進(jìn)行升級(jí)。其中,特斯拉已經(jīng)是特斯拉是進(jìn)入自動(dòng)駕駛3.0階段的領(lǐng)跑者,中國自動(dòng)駕駛企業(yè)如毫末智行也在加速?zèng)_刺。
高階自動(dòng)駕駛“降維”與智能輔助駕駛“升級(jí)”同時(shí)發(fā)生,是產(chǎn)業(yè)轉(zhuǎn)折期出現(xiàn)的新變化。總的來說,以漸進(jìn)式路線作為核心戰(zhàn)略的頭部自動(dòng)駕駛企業(yè),破解了困擾自動(dòng)駕駛的商業(yè)化難題,是比較值得關(guān)注的。
與此同時(shí),中美自動(dòng)駕駛的技術(shù)趨勢、基礎(chǔ)設(shè)施、政策引導(dǎo)、產(chǎn)業(yè)鏈情況也各有不同,所以盡管美國的特斯拉和中國的毫末智行,同為漸進(jìn)式自動(dòng)駕駛企業(yè),但在進(jìn)入3.0階段,對(duì)于大數(shù)據(jù)、大算力、大模型的戰(zhàn)略部署與落地應(yīng)用,也出現(xiàn)了一定的差異。
以特斯拉和毫末智行為例,在核心戰(zhàn)略與技術(shù)路線上是高度對(duì)齊的,都專注于漸進(jìn)式技術(shù)路線,打造智能輔助駕駛產(chǎn)品,比如特斯拉的Autopilot、毫末智行的HPilot智能輔助駕駛產(chǎn)品,并積極推動(dòng)自動(dòng)駕駛3.0階段的到來,在大數(shù)據(jù)、大模型、大算力這三大技術(shù)能力上做了大量工作。
簡單形容雙方的異同,就是前往同一目的地,但彼此會(huì)乘坐不同交通工具。接下來我們就分析一下二者的異同,可能對(duì)接下來自動(dòng)駕駛行業(yè)的發(fā)展帶來不少啟發(fā)。
目的地一:增強(qiáng)感知能力,大模型“出奇跡”
自動(dòng)駕駛技術(shù)架構(gòu)與解決方案,需要同時(shí)包含感知、決策、執(zhí)行這三部分。其中,傳統(tǒng)的自動(dòng)駕駛感知系統(tǒng)是由各類傳感器組成的,包括激光雷達(dá)、毫米波雷達(dá)及各類攝像頭。
特斯拉采用了純視覺感知路線,即去掉毫米波雷達(dá)等感知器,完全依靠車載AI攝像頭收集數(shù)據(jù),作為自動(dòng)駕駛算法的決策依據(jù)。這種模式的好處是,減少了激光雷達(dá)的使用,大大降低了自動(dòng)駕駛汽車的整體造價(jià),視覺方案對(duì)行人、交通標(biāo)志標(biāo)線等細(xì)節(jié)有很強(qiáng)的感知能力,成本優(yōu)勢明顯,有助于商業(yè)化進(jìn)展。但少了傳感器的輔助,會(huì)影響到自動(dòng)駕駛系統(tǒng)的可靠性。
中國城市場景更加復(fù)雜,毫末智行則采用視覺+雷達(dá)等多模態(tài)融合感知,其中視覺攝像頭負(fù)責(zé)細(xì)節(jié)感知,而雷達(dá)傳感器提供對(duì)環(huán)境距離、速度等的精準(zhǔn)感知,這種方案為自動(dòng)駕駛提供冗余感知,在可靠性、安全性上更勝一籌,更容易滿足城市管理者及居民對(duì)自動(dòng)駕駛的要求,減少事故發(fā)生率,對(duì)產(chǎn)業(yè)良性發(fā)展帶來助益。
為此,毫末從第一性原理出發(fā)思考自動(dòng)駕駛感知的最優(yōu)落地方案,選擇了“重感知”這一路線,在城市導(dǎo)航輔助駕駛場景,實(shí)現(xiàn)只依賴和人類駕駛員一樣的普通導(dǎo)航地圖而不依賴業(yè)界常用的高精地圖,從而避免了高精地圖覆蓋范圍、鮮度更新以及維護(hù)成本等挑戰(zhàn)。
選擇“重感知”路線的背后,其實(shí)是毫末更注重大模型算法的投入,即通過數(shù)據(jù)智能體系MANA建立強(qiáng)感知的時(shí)空理解能力,通過使用時(shí)序的transformer模型在 BEV 環(huán)視空間上構(gòu)建實(shí)時(shí)局部空間,通過這種方式讓車道線的感知輸出更加穩(wěn)定和準(zhǔn)確。通過強(qiáng)大的實(shí)時(shí)感知能力,整個(gè)過程只需要普通導(dǎo)航地圖里面的相對(duì)可靠的拓?fù)湫畔⒓纯?,最終讓車輛像我們?nèi)祟愖约洪_車一樣進(jìn)行環(huán)境感知。
感知系統(tǒng)的發(fā)展進(jìn)化,也使得數(shù)據(jù)規(guī)模不斷提升,將高維數(shù)據(jù)抽象成感知能力,這就需要高效的AI模型,進(jìn)行分析預(yù)測和控制,這也是自動(dòng)駕駛系統(tǒng)的核心技術(shù)。
總體來說,特斯拉和毫末智行都積極布局大模型的落地應(yīng)用,將Transformer引入自動(dòng)駕駛系統(tǒng)中,來提升AI模型效果,實(shí)現(xiàn)自動(dòng)駕駛系統(tǒng)感知智能和認(rèn)知智能的大幅優(yōu)化,從而減少對(duì)高精度地圖的依賴。
特斯拉使用Transformer與CNN、3D模型等相結(jié)合,組成綜合的神經(jīng)網(wǎng)絡(luò)系統(tǒng),對(duì)汽車AI攝像頭所采集的圖像數(shù)進(jìn)行跨時(shí)間的圖像融合,來實(shí)現(xiàn)基于語言模型的車道線感知、基于向量空間的路徑規(guī)劃等功能。
毫末智行從2021年7月開始,就啟動(dòng)了對(duì)Transformer的研究和落地嘗試,也是中國第一家應(yīng)用Transformer的自動(dòng)駕駛公司。借助Transformer實(shí)時(shí)建模能力,對(duì)多模態(tài)融合感知數(shù)據(jù)進(jìn)行數(shù)據(jù)前融合,搭建具有時(shí)序特征的立體場景,讓自動(dòng)駕駛系統(tǒng)具有強(qiáng)大實(shí)時(shí)感知能力,在城市環(huán)境中不依賴高精地圖,也能應(yīng)對(duì)道路模糊、復(fù)雜路口、環(huán)島等道路感知挑戰(zhàn)。比如毫末智行自研的BEV Transformer,就在城市道路上實(shí)現(xiàn)了多傳感器融合車道線識(shí)別。
此外,AI系統(tǒng)還需要在仿真環(huán)境中進(jìn)行驗(yàn)證、訓(xùn)練和迭代,場景構(gòu)建會(huì)直接影響到模型訓(xùn)練。特斯拉是基于虛幻4引擎渲染的仿真環(huán)境,來測試自動(dòng)駕駛系統(tǒng)在極端情況、復(fù)雜環(huán)境中的效果。毫末智行則選擇與阿里及德清政府合作,將真實(shí)交通流導(dǎo)入到仿真引擎中,用于路口場景的調(diào)試驗(yàn)證。二者的區(qū)別在于,特斯拉的虛擬仿真環(huán)境只用于復(fù)雜情況測試,訓(xùn)練效率高;毫末智行的真實(shí)仿真環(huán)境,對(duì)自動(dòng)駕駛系統(tǒng)的現(xiàn)實(shí)表現(xiàn)提升幫助很大,但場景重復(fù)度比較高。
目前來看,Transformer為代表的大模型,憑借對(duì)大數(shù)據(jù)優(yōu)勢的釋放、強(qiáng)大的序列建模能力、全局信息感知能力,以及為算法開發(fā)提質(zhì)增效等優(yōu)勢,正在成為自動(dòng)駕駛企業(yè)的主流選擇,而特斯拉、毫末智行也因?yàn)橄刃邢仍嚕〉昧祟I(lǐng)先優(yōu)勢。
目的地二:降本增效,讓大數(shù)據(jù)“縱享絲滑”
大模型需要海量數(shù)據(jù)的“喂養(yǎng)”,自動(dòng)駕駛感知系統(tǒng)的升級(jí)使得數(shù)據(jù)規(guī)模激增。數(shù)據(jù)量一方面是自動(dòng)駕駛企業(yè)的核心競爭力之一,另一方面也帶來了標(biāo)注、處理、分析、存儲(chǔ)等壓力和成本。因此,在自動(dòng)駕駛3.0階段,大數(shù)據(jù)的降本增效將成為自動(dòng)駕駛企業(yè)的關(guān)鍵賽點(diǎn)。
正如毫末智行CEO顧維灝所說:“樣本標(biāo)注的時(shí)間成本和金錢成本還是很高,我們需要有一種能夠直接使用大量無標(biāo)注數(shù)據(jù)的方法,這樣才能更高效地發(fā)揮出毫末在數(shù)據(jù)規(guī)模方面的優(yōu)勢”。
特斯拉和毫末智行都很重視大數(shù)據(jù)的降本增效,不過,由于歷史積累不同,雙方的大數(shù)據(jù)解決方案也各有側(cè)重。
特斯拉發(fā)展較早,數(shù)據(jù)規(guī)模遠(yuǎn)遠(yuǎn)領(lǐng)先其他自動(dòng)駕駛廠商,依靠數(shù)據(jù)引擎Data Engine,實(shí)現(xiàn)了數(shù)據(jù)驗(yàn)證、標(biāo)注、訓(xùn)練、部署的閉環(huán),充分發(fā)揮大數(shù)據(jù)的價(jià)值。不過,早期無監(jiān)督學(xué)習(xí)尚不成熟,特斯拉也依賴人工標(biāo)注與自動(dòng)化標(biāo)注同時(shí)進(jìn)行,自建了超千人的數(shù)據(jù)標(biāo)注團(tuán)隊(duì),也難免會(huì)遇到人工標(biāo)注效率低的問題。目前,特斯拉也在積極提高數(shù)據(jù)自動(dòng)標(biāo)注的質(zhì)量和效率,引入無監(jiān)督學(xué)習(xí),來對(duì)海量道路信息進(jìn)行標(biāo)注。
毫末智行創(chuàng)業(yè)初期,就很重視數(shù)據(jù)價(jià)值和數(shù)據(jù)效率,選擇使用無數(shù)據(jù)標(biāo)注的自監(jiān)督學(xué)習(xí),高效發(fā)揮出毫末在數(shù)據(jù)規(guī)模方面的優(yōu)勢。構(gòu)造了一個(gè)增量式的學(xué)習(xí)訓(xùn)練平臺(tái)MANA,通過標(biāo)注過程的自動(dòng)化,提高數(shù)據(jù)利用的效率。截至目前,數(shù)據(jù)智能體系MANA的學(xué)習(xí)時(shí)長已經(jīng)超過40萬小時(shí)。
大數(shù)據(jù)的降本增效,直接影響到自動(dòng)駕駛企業(yè)的商業(yè)化潛力。特斯拉和毫末智行依據(jù)各自的發(fā)展?fàn)顩r、先天基礎(chǔ)、技術(shù)路線、產(chǎn)業(yè)環(huán)境,已經(jīng)找到了各自的解法。
目的地三:持續(xù)投入,讓大算力“供給自由”
基于大數(shù)據(jù)、大模型的自動(dòng)駕駛系統(tǒng),需要澎湃算力的支撐,算力因此成為決定自動(dòng)駕駛系統(tǒng)天花板的關(guān)鍵要素。如何為自動(dòng)駕駛汽車和系統(tǒng)提供源源不斷的大算力,也是特斯拉、毫末智行等頭部企業(yè)所重點(diǎn)布局的領(lǐng)域。
目前來看,特斯拉和毫末智行都采取了自研硬件+超算中心的解決方案。
硬件方面,端側(cè)計(jì)算平臺(tái)來滿足自動(dòng)駕駛系統(tǒng)對(duì)計(jì)算實(shí)時(shí)性、低延遲性的高要求,來保障實(shí)時(shí)分析決策和操作指令的及時(shí)執(zhí)行。特斯拉FSD 1.0能夠提供144 TOPS算力,能夠滿足L2/L3級(jí)別自動(dòng)駕駛的需求;毫末智行推出的硬件計(jì)算平臺(tái)小魔盒3.0,算力則達(dá)到了360 TOPS,為后續(xù)的軟硬件升級(jí)留下了更多空間。
通過云端算力處理大量回傳數(shù)據(jù),訓(xùn)練迭代算法模型,更具成本優(yōu)勢和性能優(yōu)勢,特斯拉和毫末智行也都開始建設(shè)智算中心,為自動(dòng)駕駛大模型訓(xùn)練、大數(shù)據(jù)分析處理提供算力支撐。智算中心需要一定的建設(shè)周期,且投入較大,特斯拉由于布局更早,已經(jīng)研發(fā)出了專門用于自動(dòng)駕駛訓(xùn)練的云端AI芯片D1以及計(jì)算中心Dojo,其云端超算中心Dojo計(jì)劃在2023年投入使用。
毫末智行則是正在緊鑼密鼓地推出中國自動(dòng)駕駛公司的首個(gè)智算中心——毫末智算中心,率先開啟了行業(yè)基礎(chǔ)設(shè)施的探索和布局。毫末智算中心的核心目標(biāo)是滿足千億參數(shù)大模型的訓(xùn)練需求,處理數(shù)據(jù)規(guī)模100萬clips,整體訓(xùn)練成本降低200倍。大算力資源的持續(xù)投入,將使得數(shù)據(jù)訓(xùn)練和模型迭代實(shí)現(xiàn)“算力自由”。
可以看到,大算力是一個(gè)時(shí)間工程,不是一朝一夕能夠建立起競爭壁壘的,需要引起自動(dòng)駕駛企業(yè)的高度重視,特斯拉、毫末智行這樣先知先覺的發(fā)力者,則更有可能在接下來的自動(dòng)駕駛市場競爭中占據(jù)優(yōu)勢身位。
撥云見月:自動(dòng)駕駛商業(yè)化的半程風(fēng)景
經(jīng)過大模型、大數(shù)據(jù)、大算力的一路闖關(guān),特斯拉和毫末智行最終殊途同歸,都實(shí)現(xiàn)了成本更優(yōu)基礎(chǔ)上的規(guī)?;慨a(chǎn),展現(xiàn)出自動(dòng)駕駛3.0階段的商業(yè)化能力。
具體來說,特斯拉有著堪稱“生產(chǎn)狂魔”的量產(chǎn)能力,依托高度自動(dòng)化、模塊化的超級(jí)工廠,使其電動(dòng)汽車的市場占有率一騎絕塵。毫末智行也依托智能駕駛產(chǎn)品的規(guī)?;慨a(chǎn),以及智能駕駛產(chǎn)品流程化、異步并行開發(fā)的工程能力,實(shí)現(xiàn)了產(chǎn)品穩(wěn)健迭代與交付,拿下中國量產(chǎn)自動(dòng)駕駛第一名。
從這個(gè)角度看,盡管中美自動(dòng)駕駛的AI技術(shù)路線在細(xì)節(jié)上有所不同,但根本目標(biāo)都是一致的,那就是推動(dòng)自動(dòng)駕駛技術(shù)成長,讓自動(dòng)駕駛產(chǎn)業(yè)成為數(shù)字經(jīng)濟(jì)的核心支柱產(chǎn)業(yè)之一。而這個(gè)終極目標(biāo)最需要的努力也是有共性的:
1.技術(shù)能力的強(qiáng)勢崛起。毫末智行能夠加速?zèng)_刺3.0時(shí)代,靠的是底層技術(shù)的厚積薄發(fā),中國首個(gè)自動(dòng)駕駛數(shù)據(jù)智能體系MANA,中國最大規(guī)模的認(rèn)知智能場景庫,讓可行、可靠、可商用的自動(dòng)駕駛成為現(xiàn)實(shí),也讓同賽道選手很難超越。
2.商業(yè)市場的廣泛認(rèn)可。領(lǐng)先的技術(shù)能力和產(chǎn)品基礎(chǔ),為毫末智行和特斯拉帶來了市場的信任,又得以在場景中促進(jìn)數(shù)據(jù)能力的迭代,從而能生產(chǎn)出更好的產(chǎn)品,形成良性循環(huán),構(gòu)筑了市場領(lǐng)先性。
3.無人區(qū)的自主探索。如果說,技術(shù)與市場都有發(fā)展參照物,那么自動(dòng)駕駛作為一個(gè)與城市空間、社會(huì)經(jīng)濟(jì)生活深度結(jié)合的技術(shù),也需要中國企業(yè)擔(dān)負(fù)起一些新問題的探索,比如安全性的保障、參與自動(dòng)駕駛法律法規(guī)行業(yè)標(biāo)準(zhǔn)、電動(dòng)汽車的產(chǎn)業(yè)鏈共榮、低碳綠色的社會(huì)責(zé)任、東數(shù)西算工程的發(fā)展等,將自動(dòng)駕駛技術(shù)的商業(yè)價(jià)值與社會(huì)價(jià)值進(jìn)一步釋放,毫末智行為代表的中國廠商正在路上。
在所謂的“寒冬”里,特斯拉和毫末為代表的自動(dòng)駕駛企業(yè)反而踏上了開往春天的高速路。
2022年有一個(gè)特別打動(dòng)我的場景,是毫末智行的董事長、CEO等高層都是親自下場,跟技術(shù)團(tuán)隊(duì)一起,走在城市的一條條街道上路測,從白天走到黑夜,從白皮膚曬成了黑臉龐……這個(gè)畫面說明,中國自動(dòng)駕駛產(chǎn)業(yè)的路,只能由中國企業(yè)一步一個(gè)腳印地從土地里踩出來。
正是無數(shù)這樣的步履,讓我們相信,中國AI、中國企業(yè),一定會(huì)在自動(dòng)駕駛的舞臺(tái)上不斷抵達(dá)未來。