作者:翔煜 陳嬌 商瑞 北京華興萬邦管理咨詢有限公司
隨著汽車行業(yè)在“新四化”領(lǐng)域內(nèi)迅猛地進(jìn)步,汽車電子電氣架構(gòu)正在發(fā)生顯著的變化。智能化的深入促使汽車計(jì)算架構(gòu)逐步由傳統(tǒng)的以分域來進(jìn)行風(fēng)險(xiǎn)控制的分布式架構(gòu),轉(zhuǎn)向以強(qiáng)調(diào)高性能計(jì)算同時(shí)減少冗余硬件和系統(tǒng)復(fù)雜性,從而提高系統(tǒng)效率和可靠性的中央計(jì)算架構(gòu)。與此同時(shí),一些新興的功能在新車中的滲透率也在不斷提升,例如在汽車座艙內(nèi)人機(jī)界面(HMI)領(lǐng)域,諸如車內(nèi)屏幕顯示交互及后排娛樂屏幕等,其年度增長(zhǎng)率大致維持在8%左右;而在高級(jí)駕駛輔助系統(tǒng)(ADAS)方面,增長(zhǎng)率基本達(dá)到10%,部分研究機(jī)構(gòu)所報(bào)告的增長(zhǎng)率數(shù)據(jù)甚至更高。在此背景下,汽車對(duì)GPU算力的需求呈現(xiàn)出爆發(fā)增長(zhǎng)的趨勢(shì)。
汽車應(yīng)用需要更高GPU算力和硬件虛擬化
隨著先進(jìn)駕駛輔助系統(tǒng)(ADAS)和各種級(jí)別的自動(dòng)駕駛(AD)被廣泛引入到汽車應(yīng)用中,以及新一代汽車更加注重人車互動(dòng)和車與環(huán)境交互功能,汽車對(duì)車載計(jì)算單元的算力需求大幅提高。智能化汽車中的各種傳感器在短時(shí)間內(nèi)就會(huì)生成大量數(shù)據(jù),即使在較低級(jí)別的自動(dòng)駕駛系統(tǒng)中,每小時(shí)也能生成 25GB 數(shù)據(jù)。面對(duì)如此龐大的數(shù)據(jù)量,市場(chǎng)需要能夠高效處理大量信息的硬件來完成計(jì)算任務(wù)。由于CPU采用流水線處理架構(gòu),因此不能夠高效地完成集中處理這些數(shù)據(jù)的任務(wù)。
面對(duì)這些巨量的數(shù)據(jù),行業(yè)的解決辦法是采用NPU和GPU 來執(zhí)行不同的并行計(jì)算,這是因?yàn)檫@兩類架構(gòu)都具有大規(guī)模并行處理單元。在某些情況下,相比于以前的GPU,NPU的運(yùn)算速度可能更高,但是因?yàn)镹PU是一種基于特定加速器的并行計(jì)算單元,因此面對(duì)新的應(yīng)用、功能和算法,其靈活性、適應(yīng)性和產(chǎn)品生命周期遠(yuǎn)不如GPU。因此,在目前ADAS和AD還不是每輛車的標(biāo)配,以及性能需求不斷演進(jìn)變化的情況下,市場(chǎng)上完全采用NPU架構(gòu)的智駕芯片和解決方案提供商很難盈利,這些智駕芯片廠商總是在不斷地開發(fā)新的硬件(特定加速器)和流片,同時(shí)也使主機(jī)廠和tier-1總是不斷花費(fèi)巨大的人力物力來適配他們的新芯片。
鑒于性能上的顯著差異, GPU已成為同時(shí)支持智能駕駛、開發(fā)新一代座艙和支持AI功能的不二之選。GPU具備眾多計(jì)算核心,不僅能夠同時(shí)執(zhí)行大量計(jì)算任務(wù)并展現(xiàn)出卓越的并行計(jì)算能力,而且還能夠通過軟件編程的方式,在一顆基于GPU汽車主控芯片上就能完成多樣化的圖形圖像數(shù)據(jù)處理、基于渲染的人車交互和人工智能推理等各種任務(wù),因此比采用NPU架構(gòu)的智駕芯片具有更高的靈活性和可擴(kuò)展性。在實(shí)際的汽車應(yīng)用場(chǎng)景中,這種基于GPU的汽車主控芯片可以針對(duì)不同主機(jī)廠、不同車系和不同車型的需求定制自動(dòng)駕駛功能、信息娛樂系統(tǒng)和V2X方案,可以通過模組化軟件配置來大大降低主機(jī)廠及tier-1的開發(fā)難度和成本。
當(dāng)然,要完美地實(shí)現(xiàn)以上功能和利用GPU架構(gòu)的靈活性和適應(yīng)性來幫助整個(gè)智駕產(chǎn)業(yè)鏈條上的玩家降難度和減成本,就需要GPU一方面要具有足夠的算力,另一方面還要具有能夠?qū)崿F(xiàn)硬件完全隔離的虛擬化能力和可擴(kuò)展的多核心能力。除此以外,在日益普及的CPU+GPU+NPU架構(gòu)中,高算力的GPU還可以支持NPU(AI加速器)發(fā)揮人工智能的推理能力,確保車輛在行駛過程中能夠迅速做出決策,提高了系統(tǒng)的響應(yīng)速度和安全性,這種架構(gòu)中GPU的靈活性與AI加速器的高性能相得益彰,可共同推動(dòng)智能化汽車不斷邁向新的發(fā)展階段。
目前,市場(chǎng)上已經(jīng)出現(xiàn)了能夠同時(shí)滿足上述三種要求的GPU IP產(chǎn)品,為新一代基于GPU或者GPU+NPU的智駕芯片的開發(fā)提供了大力支持。Imagination Technologies公司在不久前推出的DXS GPU是業(yè)內(nèi)首款可以同時(shí)提供高算力、硬件虛擬化、多核心、支持RISC-V架構(gòu)的 GPU IP產(chǎn)品,非常適合中國(guó)智駕芯片開發(fā)商從純粹的NPU架構(gòu)轉(zhuǎn)向開發(fā)基于GPU架構(gòu)的智駕芯片,除了其DXS GPU的高算力和多核能力,而且還可以提供獨(dú)一無二的HyperLane硬件虛擬化技術(shù),幫助主機(jī)廠和tier-1用一顆主控芯片實(shí)現(xiàn)多樣化的功能及配置。
Imagination 是享譽(yù)全球的GPU IP提供商。1992年,該公司推出了創(chuàng)新的PowerVR GPU架構(gòu),采用該架構(gòu)的GPU IP不僅在桌面應(yīng)用、移動(dòng)平臺(tái)、消費(fèi)電子和游戲設(shè)備等多個(gè)領(lǐng)域產(chǎn)生了廣泛影響并持續(xù)至今,而且在汽車領(lǐng)域也被諸多領(lǐng)先的芯片企業(yè)采用,全球已有高達(dá)130億臺(tái)電子設(shè)備和汽車采用了該公司的GPU IP。Imagination 在車載領(lǐng)域擁有超過二十年的技術(shù)積累,其GPU IP被用在駕駛、座艙與信息娛樂系統(tǒng)等領(lǐng)域的芯片中;作為汽車GPU IP的領(lǐng)先供應(yīng)商,具有領(lǐng)先同儕的市場(chǎng)占有率。其DXS GPU的問世,不僅滿足了現(xiàn)代汽車對(duì)中央處理單元的高性能需求,還通過創(chuàng)新的分布式安全機(jī)制,解決了功能安全與性能、芯片尺寸之間的沖突,為汽車智能化進(jìn)程注入了強(qiáng)勁動(dòng)力。
Imagination DXS GPU 的性能優(yōu)勢(shì)
相較于上一代GPU產(chǎn)品,Imagination在設(shè)計(jì)DXS GPU時(shí)新增了一個(gè)SPU單元,從而使得DXS GPU的整體硬件性能提升了50%。得益于全新的設(shè)計(jì),最新發(fā)布的DXS GPU所采用的工藝節(jié)點(diǎn)為5納米,這使得其系統(tǒng)運(yùn)行頻率相較于上一代產(chǎn)品有了顯著提升。如需進(jìn)一步拓展,還可將其配置為四核,在主頻達(dá)到1.5GHz的條件下,DXS GPU將能夠?qū)崿F(xiàn)9TFLOPS FP32的性能以及32TOPS的int8性能。
Imagination汽車產(chǎn)品總監(jiān)章政表示:“GPU在圖形處理方面具有顯著優(yōu)勢(shì),特別是具有并行處理能力,使得GPU能夠高效地進(jìn)行大規(guī)模計(jì)算,從而提升圖形性能。我們最新推出的DXS GPU解決方案算力可從0.25 TFLOPS拓展到1.5 TFLOPS,這一可擴(kuò)展、靈活的特性可以滿足汽車中不同等級(jí)自動(dòng)駕駛對(duì)圖形處理性能和計(jì)算的需求?!?/p>
在以填充率為中心的圖形工作負(fù)載上,性能相比競(jìng)爭(zhēng)對(duì)手最高可提升28%,在安全關(guān)鍵型工作負(fù)載上更是能達(dá)到成倍的性能提升。相比IMG BXS GPU,優(yōu)化過硬件架構(gòu)DXS GPU在結(jié)合雙重速率FP16加上額外的SPU,能為FP16工作負(fù)載提供3倍性能。DXS GPU還支持FP16/FP32/INT8/DOT8等行業(yè)標(biāo)準(zhǔn)數(shù)字格式,此外,該GPU相比前代提供更大片上內(nèi)存用于加速計(jì)算。
DXS GPU提供單、雙、三、四核靈活配置,可作為多個(gè)獨(dú)立GPU核心運(yùn)行,也可作為單個(gè)大型GPU跨多個(gè)核心調(diào)度任務(wù),支持通過低帶寬總線在核心間分配工作,并支持跨Chiplet橋接,進(jìn)一步增強(qiáng)了核心之間的通信和協(xié)作能力,使得整個(gè)系統(tǒng)在處理復(fù)雜任務(wù)時(shí)更加高效和靈活。
此外,Imagination也深知軟硬件協(xié)同優(yōu)化的重要性。因此,在DXS GPU中,Imagination特別增加了片上存儲(chǔ),以減少帶寬瓶頸,同時(shí)增強(qiáng)了算術(shù)邏輯單元(ALU)計(jì)算能力。這些優(yōu)化措施使得DXS GPU在處理圖形任務(wù)時(shí)更加高效。同時(shí),Imagination還提供了強(qiáng)大的軟件支持,包括針對(duì)特定工作負(fù)載優(yōu)化的軟件庫(kù)和工具,幫助開發(fā)者充分發(fā)揮GPU的潛力,實(shí)現(xiàn)最佳的圖形性能。
車用GPU與移動(dòng)平臺(tái)所用GPU的不同:FuSa
在11月12日,Imagination宣布其DXS GPU IP正式通過SGS-TüV Saar(SGS旗下,世界領(lǐng)先的測(cè)試、檢驗(yàn)和認(rèn)證機(jī)構(gòu))的全面審核與評(píng)估,獲得了ISO 26262標(biāo)準(zhǔn)的ASIL-B級(jí)別認(rèn)證。這一成就標(biāo)志著DXS GPU所采用的獨(dú)特的分布式功能安全機(jī)制(FuSa)已經(jīng)獲得了行業(yè)內(nèi)的認(rèn)可。特別是在汽車應(yīng)用領(lǐng)域,GPU對(duì)于FuSa有著嚴(yán)格的要求,這包括了冗余設(shè)計(jì)以及在某些功能失效時(shí)的應(yīng)對(duì)策略。鑒于汽車電子系統(tǒng)的故障可能引發(fā)嚴(yán)重的交通事故,因此功能安全顯得尤為關(guān)鍵。
Imagination 的 GPU 采用獲得專利的分布式安全機(jī)制(DSM)和其HyperLane硬件虛擬化技術(shù)一樣,都是針對(duì)汽車等GPU應(yīng)用開發(fā)的高價(jià)值創(chuàng)新,可以以極小的芯片面積代價(jià)去滿足汽車應(yīng)用特定的需求。DSM通過在多個(gè)子模塊中分散部署安全檢測(cè)邏輯,實(shí)現(xiàn)對(duì)功能安全的全面覆蓋。具體包括安全對(duì)、空閑周期占用、測(cè)試向量生成與執(zhí)行、分布式故障檢測(cè)與報(bào)告等創(chuàng)新點(diǎn),在僅增加約 10% 的面積開銷的情況下,能有效檢測(cè)到超過 90% 的單點(diǎn)故障,符合 ASIL - B 的要求并獲得了認(rèn)證。
隨著汽車新四化(電動(dòng)化、智能化、網(wǎng)聯(lián)化、共享化)的不斷推進(jìn),汽車中的芯片數(shù)量將快速增加。除了關(guān)注這些芯片的算力和連接帶寬等性能之外,同樣重要的是打造和推出全新的功能安全解決方案。Imagination結(jié)合GPU這種處理器的架構(gòu)特點(diǎn),在提供業(yè)內(nèi)領(lǐng)先的算力之外,還利用GPU的運(yùn)行特點(diǎn)來打造了創(chuàng)新的分布式功能安全機(jī)制,消除了以前的鎖步等其他功能安全方案實(shí)現(xiàn)機(jī)制帶來的性能降低以及成倍片芯面積,為電子行業(yè)在相關(guān)領(lǐng)域內(nèi)的創(chuàng)新提供了一種全新的模式和思路。