2023年4月18日,聯(lián)發(fā)科車載領(lǐng)域宣布兩項重大舉動。一項是聯(lián)發(fā)科將車載領(lǐng)域芯片系列重新命名為天璣Auto,之前代號是黃山,天璣系列也是聯(lián)發(fā)科手機的高端系列;另一項是聯(lián)發(fā)科將推出旗艦車載芯片,艙駕合一,并且采用最先進的3納米工藝制造。
聯(lián)發(fā)科的3納米車載旗艦芯片還將包含完整的5G連接能力,這是聯(lián)發(fā)科與高通和英偉達最大不同,雖然高通也有這個能力,但高通沒這么做。聯(lián)發(fā)科的5G包括NTN即非地面網(wǎng)絡(luò),這是3GPP R17的一項,也就是直接連通衛(wèi)星通訊。非地面網(wǎng)絡(luò)(NTN)技術(shù)能由低軌道衛(wèi)星透過上行(Uplink)與下行(Downlink)傳輸方式讓終端使用者在偏遠地區(qū)用衛(wèi)星通訊方式進行信息雙向傳輸,彌補5G基礎(chǔ)建設(shè)在偏遠地區(qū)覆蓋率不足狀況。聯(lián)發(fā)科與英國手機制造商Bullitt Group合作將雙向信息傳輸衛(wèi)星通訊芯片搭載在手機中,未來聯(lián)發(fā)科車載芯片也將具備這個功能。聯(lián)發(fā)科5G還包括RedCap,可以看做是物聯(lián)網(wǎng)的輕量化5G,成本比較低,有可能推動V2X的發(fā)展,當然標準的5G V2X也有。除此之外,最先進的WiFi7和藍牙6.0也少不了。
與英偉達的Thor及高通的SA8795一樣,聯(lián)發(fā)科的旗艦車載芯片也是基于中央服務(wù)器Zonal架構(gòu)設(shè)計,即依托車載以太網(wǎng)做骨干,所有的運算都集中在一個或兩個中央服務(wù)器芯片上處理。
Zonal架構(gòu)實際上就是車輛計算系統(tǒng)進化為PC架構(gòu),即所有的運算都由一顆或兩顆CPU完成,所有的應(yīng)用都由CPU來執(zhí)行,或許再加一片GPU/AI加速器。外設(shè)與接口基本固定,底層軟件系統(tǒng)也固定,底層系統(tǒng)對程序員來說幾乎完全透明,程序員只需要開發(fā)具體應(yīng)用,就像現(xiàn)在的PC都是基于Windows系統(tǒng)+CPU一樣,真正的軟件定義汽車。
Zonal架構(gòu)是汽車電子架構(gòu)的終極形態(tài),就像電腦自2000年后就已經(jīng)完全定型。進入Zonal時代,這些電腦或服務(wù)器代工廠可以無縫切入車載運算系統(tǒng)代工,沒有任何障礙,二者的技術(shù)需求完全一致,并且PC廠家更擅長大算力系統(tǒng),算力越大,PC廠家優(yōu)勢越明顯,因為它們早已掌握了服務(wù)器的技術(shù),水冷更加擅長。
聯(lián)發(fā)科車機客戶主要有長安汽車、吉利汽車、上汽大通、東風汽車、上汽通用五菱、億咖通、滴滴出行和順豐。聯(lián)發(fā)科有一個特別強的合作伙伴,深圳掌銳。掌銳助力吉利E01(MT8665)平臺,研發(fā)兩班倒,項目從KO到量產(chǎn)半年以內(nèi)完成;也助力長安iCAR平臺,全新平臺項目從KO到量產(chǎn)一年以內(nèi)完成。目前,聯(lián)發(fā)科主推MT8666和MT8675。
更先進的是MT2715,估計也采用了7納米工藝,有三個版本:高配版4x A78 @1.6G,4x A55 cores @1.4G;中配3x A78 @ 1.4G, 4x A55 @ 1.2G;低配2x A78 @ 1.4G,4x A55 @ 1.2G。
GPU還是不花太多成本,Mali-G57 MC5,僅有281G FLOPS (FP32) 。AI算力未知。
聯(lián)發(fā)科的黃山系列出貨量已超千萬片,自2022年伊始,聯(lián)發(fā)科開始對車載領(lǐng)域越來越重視,并且聯(lián)發(fā)科延續(xù)手機領(lǐng)域?qū)垢咄ǖ霓k法,就是比高通在制造工藝上領(lǐng)先,例如聯(lián)發(fā)科在天璣9000上首次使用4納米工藝,一段時間內(nèi)超越了高通旗艦性能。車載領(lǐng)域也如法炮制,聯(lián)發(fā)科2023年將推出兩款4納米工藝車載芯片,這也是全球首個4納米車規(guī)芯片,高端型號是MT8676,低端型號為MT8673。
聯(lián)發(fā)科與高通相比,最大的差距在GPU和AI上,高通SA8155P的GPU算力是1142GFLOPs,SA8295P是3000GFLOPs。這是因為GPU最耗費成本,聯(lián)發(fā)科主打的就是高性價比,因此GPU算力一向不高。AI算力提升較容易,聯(lián)發(fā)科天璣9200使用的APU 690有30TOPS@INT8的算力,SA8295P也是30TOPS@INT8,不過SA8295P的30TOPS是包含了CPU、GPU、DSP和HTP的。聯(lián)發(fā)科未公布MT8676的任何信息,只能大概推測,MT8676挑戰(zhàn)目標可能是SA8295P,MT8676很大可能是聯(lián)發(fā)科天璣9000的車載版。
MT8676可能采用4個Cortex-x2加4個Cortex-A510,這樣在CPU算力上可以超越SA8295P;GPU方面,聯(lián)發(fā)科一向節(jié)約,估計會是MALI-G710 MC10或MC16,頻率可能會比手機高一些,估計是800-900MHz,算力大約1200-1500GFLOPs之間;APU或者說NPU用5代,算力估計是18-22TOPS之間,5G Modem、WiFi、藍牙、GPS都會集成進去,性價比較SA8295P要高不少。
車載與手機最大區(qū)別是手機更看重單核性能,而車載更看重多核性能。早期手機也是看重多核性能,隨著短視頻和手機游戲的爆發(fā),大部分人都是抱著手機劃來劃去幾個小時,這時候單核性能重要性就凸顯了,手機從4大核加4小核改變?yōu)榻裉斓?個超大核?+ 3個大核?+ 4個小核。手機領(lǐng)域的設(shè)計在車載領(lǐng)域顯得有些不合時宜了。高通從第四代起手機和車載基本分家,車載和筆記本電腦用CPU高度重合,電腦也是更看重多核性能。
未來聯(lián)發(fā)科的3納米芯片會是怎樣的設(shè)計,不妨做個大膽的推測。ARM的超大核不太適合車載,性價比偏低,并且ARM依仗自己的霸主地位,持續(xù)擠牙膏,留了足夠的升級空間。聯(lián)發(fā)科可能會和英偉達一樣選擇ARM的服務(wù)器系列Neoverse,服務(wù)器領(lǐng)域ARM要挑戰(zhàn)x86,必須全力以赴,不能擠牙膏。
Neoverse系列分V、N和E三條產(chǎn)品線。其中,V主打高性能,N注重平衡效率與性能,E為高效率。英偉達的Thor選擇V2平臺做CPU。
執(zhí)行端關(guān)鍵的參數(shù)是發(fā)射寬度Issue Width,目前最寬的是ARM的V1,多達15位,寬度越寬,ALU和FPU數(shù)量可以越多。通常ALU是4個,整數(shù)運算單元4個就夠。V1有4個ALU,4個針對浮點的NEON,其中包含兩個SVE。還有3個Load加載,2個寫入Store。還有兩個分支針對特定計算類型。影響CPU算力最關(guān)鍵的參數(shù)是Decode Wide譯碼寬度,譯碼寬度可簡單等同于每周期指令數(shù)量即IPC,即每個周期完成多少個指令。
最新的Cortex-X3則是6位。
這里也能看出X2相對X1提升很少。
GPU方面,聯(lián)發(fā)科可能采用和天璣9200一樣的MALI G715。
Immortalis-G715、Mali-G715和Mali-G615都采用第四代Valhall體系結(jié)構(gòu),它們之間的差異只是著色器的配置和計算單元數(shù)量不同。其中Immortalis-G715定位旗艦,也是家族唯一硬件支持光線追蹤技術(shù)的GPU IP,最多可以搭配16個RTU,可選10~16個計算單元。
天璣9200用了11個Immortalis-G715,650MHz下達到2000 GFLOPS的算力,如果16個Immortalis-G715,再配合750MHz的頻率,GPU算力可達3.2TFLOPS,這個算力足以超過SA8295P和SA8795P,當然和英偉達的GPU算力還是沒法比。
聯(lián)發(fā)科的第六代APU,和高通的DSP一樣,支持混合精度計算,也支持定點和浮點運算。
NPU或者說AI是門檻最低的,對聯(lián)發(fā)科來說易如反掌,聯(lián)發(fā)科只需要將APU 690的數(shù)量增加一個,整體AI算力就能超過60TOPS,這個數(shù)值足以超過高通的SA8795P,和英偉達的2000TOPS當然是沒法比,不過解決辦法很簡單,外掛一個單獨的AI加速器即可,AI加速器門檻很低。
鹿死誰手,讓我們拭目以待吧!