“Hey Mercedes(你好,奔馳),附近最適合游泳的海灘在哪里?”“你可以去這里游泳,曬日光浴或者沖浪。另外,你可以散步、野餐,或者只是放松和看書。如果你精力充沛,你還可以和朋友玩沙灘排球或者飛盤。無論你選擇做什么,我希望你能玩得開心?!币欢握鎸?shí)用戶的體驗(yàn)視頻揭開了搭載ChatGPT后奔馳AI智能語音助手的神秘面紗。
近日,ChatGPT掀起的大模型之火,蔓延到了智能汽車場景之中。梅賽德斯-奔馳和微軟官宣正在合作測試車載ChatGPT人工智能,并將面向約90萬車主開啟測試。這是ChatGPT首次“上車”,標(biāo)志著智能汽車領(lǐng)域的大模型之戰(zhàn)正式開啟。
智能汽車的“ChatGPT時(shí)刻”來了?
大模型將重構(gòu)各行各業(yè)雖已成為業(yè)界共識(shí),但ChatGPT“上車”遠(yuǎn)比預(yù)想中來得更快。作為繼家庭和辦公場所之外的“第三空間”,汽車正在變成一個(gè)新型智能終端。人車交互是汽車智能化的標(biāo)簽,而AI語音助手則成為了智能汽車的“標(biāo)配”。
與普通的語音助手不同,奔馳的車載ChatGPT語音助手可以處理完整的對話,例如追問,并且能保持對前后文的理解。據(jù)悉,微軟還在與梅賽德斯-奔馳探索ChatGPT的插件生態(tài)系統(tǒng),為第三方服務(wù)集成開辟可能性。駕駛員未來有望通過車載系統(tǒng)就能完成預(yù)訂餐廳、預(yù)定電影票等任務(wù),進(jìn)一步提高便利性和生產(chǎn)力。
大模型上車帶來的不僅是AI語音助手的升級(jí),還將推動(dòng)智能駕駛技術(shù)的進(jìn)階。繼奔馳搭載ChatGPT之后,理想汽車也發(fā)布了自研大模型MindGPT,宣布新一代理想汽車不再依賴高精地圖的城市NOA產(chǎn)品,將做到接近人類司機(jī)的駕駛表現(xiàn)。業(yè)內(nèi)專家分析稱,大模型具備對海量數(shù)據(jù)的處理能力以及多維度分析能力,可以提供更精準(zhǔn)、更全面的數(shù)據(jù)分析和預(yù)測能力,持續(xù)優(yōu)化模型,提高智能駕駛的準(zhǔn)確性和可靠性。
與此同時(shí),車載操作系統(tǒng)正在被大模型重塑。近日,斑馬智行第三代汽車AI能力體系Banma Co-Pilot在阿里通義千問大模型的賦能下,實(shí)現(xiàn)了AliOS車載操作系統(tǒng)的全面升級(jí)。開源證券研報(bào)指出,大模型時(shí)代,第三方科技巨頭的加入有望通過提供強(qiáng)大工具鏈形成自動(dòng)駕駛行業(yè)的“安卓”,幫助整車廠構(gòu)建自己的自動(dòng)駕駛算法和數(shù)據(jù)閉環(huán)系統(tǒng),同時(shí)依靠大模型的數(shù)據(jù)生成能力,縮小與頭部玩家在數(shù)據(jù)領(lǐng)域的差距。
此外,大模型還將激起汽車產(chǎn)業(yè)的生產(chǎn)、研發(fā)模式的創(chuàng)新變革。理想汽車創(chuàng)始人李想舉了這樣一個(gè)例子:“過去我們一年要做大概1000萬幀的自動(dòng)駕駛圖像的人工標(biāo)定,所以我們請了很多外包公司進(jìn)行標(biāo)定,大概6元到8元錢一張,一年的成本接近一億元,這僅僅是來做自動(dòng)駕駛方面的圖片標(biāo)定。但是當(dāng)我們使用大模型,通過訓(xùn)練的方式進(jìn)行自動(dòng)化標(biāo)定,過去需要用一年做的事情基本上3個(gè)小時(shí)就能完成,效率是人的1000倍?!比绾慰焖俸推嚠a(chǎn)業(yè)原有的知識(shí)體系相融合,如何與大模型的學(xué)習(xí)能力、泛化能力協(xié)同,形成更有效率的生產(chǎn)、研發(fā)方式,正在成為汽車產(chǎn)業(yè)接下來研究的核心課題。
可見,大模型正在從研發(fā)設(shè)計(jì)模式、人機(jī)交互、智能駕駛、用戶生態(tài)等方方面面給整個(gè)汽車產(chǎn)業(yè)帶來深刻影響,加速驅(qū)動(dòng)產(chǎn)業(yè)生態(tài)的智能化、高效化、安全化和可持續(xù)發(fā)展。
國內(nèi)汽車廠商圍繞大模型展開多方探索
盡管奔馳與微軟的合作被稱作是ChatGPT在汽車領(lǐng)域的首個(gè)應(yīng)用,但也有觀點(diǎn)認(rèn)為,奔馳實(shí)際上是趕了個(gè)“晚集”。在前不久的上海汽車展上,國內(nèi)眾多汽車廠商皆展示了大模型方面的布局。
“ChatGPT成功后,如今正向多應(yīng)用生態(tài)發(fā)展,車企也想將GPT的熱度引導(dǎo)到智能車聯(lián)網(wǎng)領(lǐng)域?!闭憬髮W(xué)國際聯(lián)合商學(xué)院數(shù)字經(jīng)濟(jì)與金融創(chuàng)新研究中心聯(lián)席主任、研究員盤和林表示。從功能上來看,目前人工智能在汽車上主要有兩種落地形式:一類是用于人工智能交流對話領(lǐng)域,多數(shù)應(yīng)用在智能座艙,比如百度的文心一言,已有東風(fēng)日產(chǎn)、紅旗、長城等近十家車企宣布接入;上海車展期間,商湯科技亮相日日新Sensenova大模型,展示了其中文語言模型“商量SenseChat”以及“如影SenseAvatar”等與座艙的結(jié)合;此前阿里巴巴也宣布AliOS智能汽車操作系統(tǒng)已接入通義千問大模型進(jìn)行測試等。
另一類是聚焦智能駕駛,比如毫末智行發(fā)布了自動(dòng)駕駛生成式大模型DriveGPT,幫助解決認(rèn)知決策問題,最終實(shí)現(xiàn)端到端的自動(dòng)駕駛。理想汽車自研大模型MindGPT,擺脫對高精地圖的依賴,讓汽車做到更接近人類司機(jī)的駕駛表現(xiàn)。蔚來、小鵬、長城、奇瑞四家車企也已注冊申請了多個(gè)與GPT相關(guān)的商標(biāo)。
乘聯(lián)會(huì)數(shù)據(jù)顯示,2022全年我國銷售新能源乘用車523.3萬輛,其中智能汽車240.4萬輛,占比45.94%。比亞迪、長安、嵐圖、問界等國內(nèi)品牌已經(jīng)走在智能汽車行業(yè)前列。
相較于通用型大模型,垂直領(lǐng)域的大模型訓(xùn)練和使用成本較低,或許會(huì)成為更容易實(shí)現(xiàn)商業(yè)落地的領(lǐng)域。業(yè)內(nèi)人士分析稱,汽車有著明確的交互需求,且相較于通用大模型,垂直領(lǐng)域的應(yīng)用場景相對較小,對參數(shù)的量級(jí)要求也沒有通用型AI那么大。因此,無論是傳統(tǒng)汽車廠商、造車新勢力,還是大模型科技廠商,普遍認(rèn)為智能汽車最有可能成為率先實(shí)現(xiàn)大模型落地的B端場景。
大模型真正“上車”仍需時(shí)日
ChatGPT的首發(fā)“上車”已經(jīng)拉開了智能汽車領(lǐng)域大模型之爭的序幕,但需要指出的是,現(xiàn)階段距離大模型真正落地汽車行業(yè)還有一段距離。
專家普遍認(rèn)為,目前汽車領(lǐng)域?qū)τ诖竽P偷膽?yīng)用仍處于初期的嘗試階段。對于想做大模型的汽車廠商而言,多模態(tài)數(shù)據(jù)的收集、處理、訓(xùn)練是一個(gè)難題。自動(dòng)駕駛所需傳感器數(shù)據(jù)包括激光雷達(dá)、毫米波雷達(dá)、超聲波雷達(dá),以及高清攝像頭、GPS等。這些數(shù)據(jù)來自不同的坐標(biāo)系,帶有不同的觸發(fā)時(shí)間戳,且要考慮到硬件損壞等問題;同時(shí),需要大量的場景數(shù)據(jù),比如交通標(biāo)志線、交通流、行為模型等。這讓汽車大模型的研發(fā)、訓(xùn)練門檻變得很高。
數(shù)據(jù)來源:汽車銷量數(shù)據(jù)為上險(xiǎn)數(shù)據(jù),汽車之家研究院
中國工程院院士、清華大學(xué)教授、國家智能網(wǎng)聯(lián)汽車創(chuàng)新中心首席科學(xué)家李克強(qiáng)指出,模型數(shù)據(jù)調(diào)動(dòng)管理需要利用智能網(wǎng)聯(lián)汽車以及計(jì)算技術(shù)平臺(tái)、云控技術(shù)平臺(tái)等平臺(tái),只有大量的數(shù)據(jù)匯聚才可做交叉,特別是垂直領(lǐng)域,這和娛樂系統(tǒng)、服務(wù)系統(tǒng)不一樣,從產(chǎn)業(yè)互聯(lián)網(wǎng)的角度來看,若基礎(chǔ)云平臺(tái)不能打通,很難實(shí)現(xiàn)向深層領(lǐng)域推進(jìn)。
在加拿大工程研究院院士、人工智能與數(shù)字經(jīng)濟(jì)廣東省實(shí)驗(yàn)室(深圳)執(zhí)行主任于非看來,駕駛中有信息系統(tǒng)模型、思考模型、執(zhí)行模型三部分,生成式的AI大模型意味著在知識(shí)方面和信息方面取得了突破,但并不意味著目前它能在汽車上執(zhí)行,也就是控制層面取得突破。于非也認(rèn)為,“車路人云”協(xié)同可以讓行業(yè)產(chǎn)生大裂變,但要AI大模型發(fā)展對智能網(wǎng)聯(lián)汽車發(fā)展產(chǎn)生突破性影響還需要時(shí)間。
地平線CTO黃暢認(rèn)為,GPT在自動(dòng)駕駛場景中最先應(yīng)用的很可能是環(huán)境模型的預(yù)測和交互式規(guī)控和規(guī)劃?!斑@個(gè)場景不需要特別的大規(guī)模參數(shù)模型,因?yàn)樗皇且粋€(gè)完整的端到端閉環(huán),尤其因?yàn)樗P(guān)注于預(yù)測和規(guī)劃,不用花太多精力在感知這個(gè)層面上,因此很可能在百Tops級(jí)別的算力平臺(tái)上就能應(yīng)用,在3~5年內(nèi)就可以初步上線。而從感知到定位地圖到規(guī)控,整個(gè)端到端的閉環(huán)做出來,則需要一個(gè)更大規(guī)模的參數(shù)模型,大概需要5~10年的時(shí)間?!彼f。
從部署方面看,大模型需要高規(guī)格的硬件配置,包含高性能計(jì)算能力、大容量內(nèi)存和低時(shí)延等特點(diǎn),但車載設(shè)備的硬件條件相對有限,無法提供足夠的計(jì)算資源支撐大模型運(yùn)行。例如在自然語言處理領(lǐng)域的 GPT-3 模型就需要數(shù)萬億Tops的計(jì)算能力。這要求芯片的算力至少要在萬級(jí)Tops以上才能夠勝任大型模型的計(jì)算任務(wù)。但是,在車載部署場景下,芯片的算力往往只有數(shù)百Tops,遠(yuǎn)遠(yuǎn)達(dá)不到大型模型的要求。
智算中心被視為大模型落地汽車行業(yè)必不可少的基礎(chǔ)設(shè)施。特斯拉發(fā)布了獨(dú)立的云端智算中心——Dojo,總計(jì)使用了1.4萬個(gè)英偉達(dá)的GPU來訓(xùn)練AI模型。小鵬汽車和阿里云合建了智算中心“扶搖”,專門用于自動(dòng)駕駛模型訓(xùn)練,算力規(guī)模達(dá)600PFLOPS。毫末和火山引擎聯(lián)合打造了國內(nèi)自動(dòng)駕駛行業(yè)最大的智算中心“雪湖·綠洲(MANA OASIS)”,每秒浮點(diǎn)運(yùn)算可達(dá)67億億次。有業(yè)內(nèi)人士呼吁,自動(dòng)駕駛行業(yè)的大模型要成功,全自動(dòng)駕駛行業(yè)的數(shù)據(jù)需要像互聯(lián)網(wǎng)數(shù)據(jù)一樣公開,這需要監(jiān)管機(jī)構(gòu)、行業(yè)參與者等共同推進(jìn)。
此外,奧緯咨詢董事合伙人張君毅表示,車企們爭相獨(dú)立布局大語言模型技術(shù),技術(shù)資源和注意力容易被分散,由于基層算法人才的趨利流動(dòng)和大算力GPU的分配,有可能會(huì)在一定程度上影響干擾自動(dòng)駕駛的市場發(fā)展。產(chǎn)業(yè)鏈上下游應(yīng)加強(qiáng)分工合作,避免“重復(fù)造輪子”。
作者丨宋婧? 編輯丨劉晶
美編丨馬利亞? 監(jiān)制丨連曉東