作者 | 百日夢想家
編輯 | 王博
智算中心拼什么?
2022年過去,數(shù)據(jù)驅(qū)動成為自動駕駛演進共識。沿著數(shù)據(jù)驅(qū)動這條路線,自動駕駛加速邁入智算時代。
智算中心應運而生。
實際上,將智算引入自動駕駛的開先河者是特斯拉,其率先發(fā)布了專用于自動駕駛訓練的超級計算中心Dojo,此后,一眾玩家如毫末、小鵬等紛紛宣布建立智算中心。
各大智算中心比拼什么?
答案是,如何用低成本且高效的方式實現(xiàn)海量數(shù)據(jù)的閉環(huán)驅(qū)動。
“自動駕駛大模型加速降低開發(fā)成本,數(shù)據(jù)更接近人駕環(huán)境?;诹慨a(chǎn)實車數(shù)據(jù)的仿真技術(shù)將與自動駕駛云端超大模型結(jié)合,迎來新突破。超算中心成為自動駕駛的入門配置?!焙聊┲切卸麻L張凱在2023十大自動駕駛趨勢預測中表示。
1月5日,在第七屆HAOMO AI DAY上,毫末智行正式發(fā)布了由其與字節(jié)跳動旗下火山引擎聯(lián)合打造的智算中心雪湖綠洲(MANA OASIS),這也是中國自動駕駛公司首個設立的智算中心。
“綠洲”登場,為我們揭開了智算時代的戰(zhàn)場一角,也讓毫末成為對陣特斯拉中最有看點的自動駕駛公司之一。
1、自建智算中心,劍指數(shù)據(jù)閉環(huán)
這應該是目前中國自動駕駛行業(yè)最大智算中心了。
每秒浮點運算可達67億億次,存儲帶寬每秒2T,通信帶寬每秒800G,毫末官方在介紹MANA OASIS時給出這樣一組數(shù)據(jù)。?
基于火山引擎豐富的大數(shù)據(jù)積累和底層技術(shù),MANA OASIS實現(xiàn)了計算、存儲、通訊能力,可讓數(shù)據(jù)更快速轉(zhuǎn)化成知識。
有了這一新利器,毫末智行CEO顧維灝宣布,預計2024年上半年,毫末城市NOH落地將達到100城,2025年實現(xiàn)全無人駕駛。
MANA OASIS的出現(xiàn)是有其背景的。
隨著感知技術(shù)與計算平臺的逐漸成熟與趨同,影響高階自動駕駛落地的關(guān)鍵因素,不再是解決常見的一般案例,而是解決“路口”問題,也即各類不常見,但不斷出現(xiàn)的“長尾問題”,
作為一種模仿人類的科學,AI自動駕駛與人類認知世界的邏輯基本一致,想讓汽車更好地理解世界,就需要構(gòu)建更精準的模型。但算法模型的建立并非一勞永逸,自動駕駛車輛在行駛過程中總會遇到各種陌生場景。
因此,如何對新場景數(shù)據(jù)進行大規(guī)模高效處理并快速優(yōu)化算法模型,即成為自動駕駛技術(shù)迭代的關(guān)鍵。換言之,構(gòu)建基于數(shù)據(jù)驅(qū)動的自動駕駛數(shù)據(jù)閉環(huán),讓數(shù)據(jù)實現(xiàn)高效流動,是實現(xiàn)高階自動駕駛的必由之路。
為滿足實現(xiàn)數(shù)據(jù)閉環(huán)的所需要的超大算力數(shù)據(jù)中心,MANA OASIS出現(xiàn)了。
它的直接任務,便是為毫末智行的MANA數(shù)據(jù)智能體系提供超級算力,幫助MANA的五大模型實現(xiàn)低成本且高效的迭代。
MANA OASIS具備4大核心能力,包括以穩(wěn)健系統(tǒng)架構(gòu)保證高效存儲和網(wǎng)絡通訊、數(shù)據(jù)管理能力、算力優(yōu)化能力以及訓練加速能力。
顧維灝介紹,基于火山引擎豐富的大數(shù)據(jù)積累和底層技術(shù),MANA OASIS實現(xiàn)的計算、存儲、通訊能力,可以讓GPU不再等待數(shù)據(jù),數(shù)據(jù)轉(zhuǎn)化成知識的速度也會更快。毫末數(shù)據(jù)、算力、訓練效率也迎來全面提升。
具體來看,在數(shù)據(jù)管理能力方面,為充分發(fā)揮智算中心價值,讓GPU持續(xù)飽和運行,毫末歷經(jīng)2年研發(fā),建立了全套面向大規(guī)模訓練的Data Engine,實現(xiàn)了百P數(shù)據(jù)篩選速度提升10倍、百億小文件隨機讀寫延遲小于500us。
在算力優(yōu)化方面,毫末與火山引擎合作,部署了Lego高性能算子庫、ByteCCL通信優(yōu)化能力、以及大模型訓練框架。軟硬一體,把算力優(yōu)化到極致。
在訓練效率方面,基于Sparse MoE,通過訓練平臺的持續(xù)優(yōu)化,毫末可實現(xiàn)單機訓練百億參數(shù)大模型,以及實現(xiàn)跨機共享expert的方法,完成千億參數(shù)規(guī)模大模型訓練,訓練成本降低到百卡周級別,訓練效率提升100倍。
那么,MANA OASIS是怎么提升毫末的數(shù)據(jù)閉環(huán)效率的呢?
2、幫助MANA五大模型升級,更低成本、更高效
基于MANA OASIS智算中心,MANA數(shù)據(jù)智能體系的五大模型迎來了升級。
這五大模型包括:視頻自監(jiān)督大模型、3D重建大模型、多模態(tài)大模型、動態(tài)環(huán)境大模型以及人駕自監(jiān)督認知大模型。
其中,視頻自監(jiān)督大模型、3D重建大模型的應用目的是為了降低成本,另外三個大模型的應用是為了提升數(shù)據(jù)流轉(zhuǎn)效率。
具體來說,毫末智行視頻自監(jiān)督大模型主要做數(shù)據(jù)標注工作,能夠讓毫末 4D clip 標注實現(xiàn) 100%自動化,人工標注成本降低 98%。
3D 重建大模型可以實現(xiàn)以低成本獲取 normal case,生成各種高成本 corner case,其生成的數(shù)據(jù),不僅比傳統(tǒng)的人工顯式建模再渲染紋理的方法效果更好、成本更低,增加 NeRF 生成的數(shù)據(jù)后,還可將感知的錯誤率降低 30%以上。
多模態(tài)互監(jiān)督大模型,能夠精準識別異形障礙物。毫末智行通過引入激光雷達作為視覺監(jiān)督信號,直接使用視頻數(shù)據(jù)來推理場景的通用結(jié)構(gòu)表達,而通用結(jié)構(gòu)的檢測,可以很好地補充已有的語義障礙物檢測,有效提升自動駕駛系統(tǒng)在城市復雜工況下的通過率。
動態(tài)環(huán)境大模型,可以精準預測道路的拓撲關(guān)系,讓車輛始終行駛在正確的車道中。
毫末智行通過在 BEV(鳥瞰圖)的 feature map(特征圖)基礎(chǔ)上,以標精地圖作為引導信息,使用自回歸編解碼網(wǎng)絡,將 BEV 特征,解碼為結(jié)構(gòu)化的拓撲點序列,實現(xiàn)車道拓撲預測,從而使毫末智行在感知能力上能夠像人類一樣在標準地圖的導航提示下就可以實現(xiàn)對道路拓撲結(jié)構(gòu)的實時推斷。
毫末智行認為,解決了路口問題實際就解決了大部分城市 NOH 問題,目前在保定、北京,毫末對于 85%的路口拓撲推斷準確率高達 95%。即便是非常復雜、非常不規(guī)則的路口,毫末也能準確預測。
人駕自監(jiān)督認知大模型,能夠掌握高水平司機的開車技法,讓駕駛決策更聰明。
在探索“使用大量人駕數(shù)據(jù),毫末智行全新引入用戶真實的接管數(shù)據(jù),同時用 RLHF(從人類反饋中強化學習)思路先訓練一個 reward model(獎勵模型)來挑選出更好的駕駛決策。通過這種方式,使毫末智行在掉頭、環(huán)島等公認的困難場景中,通過率提升 30%以上。
此外,基于綠洲的支持,MANA最新的車端感知架構(gòu),從過去分散的多個下游任務都集成到一起,形成一個更加端到端架構(gòu),包括紅綠燈、局部路網(wǎng)、預測等任務,實現(xiàn)了跨代升級。
以上這些,意味著毫末的感知能力更強,自動駕駛功能有了更大的可挖掘空間。
3、2025年實現(xiàn)全無人駕駛,毫末的底氣是什么?
此次AI DAY上,毫末智行正式宣布將在2025年實現(xiàn)全無人駕駛。
毫末智行的底氣在是什么?顧維灝給出的答案,是重感知的技術(shù)路線、大模型的技術(shù)應用。
這里有一個先后順序,需要先有大量數(shù)據(jù),再進行數(shù)據(jù)的處理和應用。
在智算中心之前,毫末智行率先引入Transform等新技術(shù),確立以數(shù)據(jù)閉環(huán)驅(qū)動形式的數(shù)據(jù)智能體系MANA,其已經(jīng)成為毫末智行所有產(chǎn)品迭代的核心動力,截止目前,其學習時長已經(jīng)超過42萬小時,虛擬世界駕齡相當于人類司機5.5萬年的駕齡。
當前,毫末智行已經(jīng)完成數(shù)十萬全要素、多模態(tài)CLIPS的標注,在場景庫積累方面已經(jīng)建設完成300萬小時中國道路駕駛認知場景庫,可以真正做到感知智能和認知智能的有效協(xié)同。
之后,怎么更好的處理數(shù)據(jù)。
智算中心的建立,能夠讓毫末智行在實現(xiàn)數(shù)據(jù)高效流轉(zhuǎn)閉環(huán)的同時,還能夠降低整個研發(fā)成本,從而促進自動駕駛系統(tǒng)快速實現(xiàn)量產(chǎn)落地。
值得一提的事,毫末智行自研的AEB算法助力魏牌、歐拉、坦克共計四款車型獲得ENCAP、ANCAP五星安全,毫末是中國首個自研AEB算法落地海內(nèi)外的公司,毫末也成為第一個出海歐洲、澳洲的自動駕駛公司。
在專利方面,截止到2022年12月,毫末擁有專利證書146件,全面覆蓋數(shù)據(jù)融合、智能感知、智能決策、控制執(zhí)行、模型算力提升等領(lǐng)域。
實際上,毫末還有一重優(yōu)勢,那就是背靠長城的量產(chǎn)優(yōu)勢。
毫末智行能夠快速實現(xiàn)量產(chǎn)能力,也是能夠反哺其自動駕駛技術(shù)快速升級迭代的重要因素之一。
目前正在陸續(xù)交付中的車型有摩卡DHT-PHEV激光雷達版、歐拉閃電貓、歐拉芭蕾貓、全新一代長城炮等。
這些車型上市之后,也能夠為毫末智行提供越來越多的高質(zhì)量的自動駕駛數(shù)據(jù),助力其自動駕駛系統(tǒng)不斷迭代升級。
截止2022年底,毫末HPilot搭載車型近20款,已經(jīng)搭載上市車型包括魏牌摩卡、魏牌拿鐵、魏牌瑪奇朵、坦克300、坦克500、哈弗神獸、拿鐵DHT-PHEV等。用戶輔助駕駛行駛里程突破2500萬公里。
城市輔助駕駛上,毫末智行的城市NOH軟件達到交付狀態(tài),目前已經(jīng)開啟多城路測,毫末城市 NOH 是中國第一個可大規(guī)模落地的城市導航輔助駕駛,搭載毫末城市 NOH 的車型將在 2023 年上市。預計在2024年上半年落地城市達到100個。
毫末智行雖然成立僅三年時間,但已經(jīng)穩(wěn)居中國量產(chǎn)自動駕駛第一名。憑借此次發(fā)布的智算中心綠洲,毫末在自動駕駛領(lǐng)域的身位將持續(xù)靠前。
4、技術(shù)路線殊途同歸,自動駕駛決戰(zhàn)2025
自動駕駛行業(yè)已經(jīng)進入以商業(yè)化量產(chǎn)為主的下半場競爭。
據(jù)不完全統(tǒng)計,除北上廣之外,深圳、重慶、長沙等40多個省市,都積極出臺相應管理辦法或?qū)嵤┘殑t,從載人測試、道路測試、示范運營到無人化等多個階段開展探索,大力推進自動化駕駛。
同時,據(jù)《中國自動駕駛乘用車市場數(shù)據(jù)追蹤報告》發(fā)布的數(shù)據(jù)顯示,2022年1季度國內(nèi)L2級自動駕駛在乘用車市場的新車滲透率已達23.2%。
汽車之家研究院最新的一組報告預測,到2025年,中國L2級以上智能汽車銷量將超過1000萬輛,相應的智能汽車滲透率將達到49.3%。
與數(shù)據(jù)形成對比的,則是國內(nèi)企業(yè)在自動駕駛賽道中激進的態(tài)度。
除了毫末外,百度此前宣布將于2023年打造全球最大無人駕駛服務區(qū),華為計劃將在2025年成為中國自動駕駛領(lǐng)導者。小馬智行則表示2025年無人駕駛講迎來真正的商業(yè)化應用。
與此同時,隨著自動駕駛商業(yè)化落地競爭的開始,不管是走漸進式路線,還是跨越式路線,亦或者是純感知路線,或多傳感器融合路線,最終大家的目的都在殊途同歸,即加速自動駕駛技術(shù)的量產(chǎn)落地,搶占自動駕駛決賽入場資格。
有業(yè)內(nèi)人士表示,預計到2025年,自動駕駛行業(yè)的入場券將會截止。而作為國內(nèi)走在自動駕駛量產(chǎn)前列的企業(yè),毫末智行無疑已經(jīng)獲得2025決賽入場資格證。
張凱曾提到,數(shù)據(jù)是驅(qū)動自動駕駛成熟的核心要義,漸進式路線是數(shù)據(jù)積累的最佳路徑。如今,隨著智算中心綠洲的出現(xiàn),毫末對數(shù)據(jù)和大模型的應用越來越嫻熟,自動駕駛再進一步已是順理成章。