去年筆者曾經(jīng)對近30款汽車座艙芯片做了排名,能夠超越高通SA8295的座艙芯片僅有三款,其中就有聯(lián)發(fā)科的MT8676,最近安兔兔網(wǎng)站出現(xiàn)了MT8676的跑分成績單,這意味著使用MT8676的車機(jī)即將上市。
性能方面,目前安兔兔車機(jī)版統(tǒng)計(jì)到的總分為1026462,其中CPU成績?yōu)?93832,GPU成績?yōu)?82425,MEM成績?yōu)?78927,UX成績則是171278。
單論跑分,MT8676基本和SA8295持平或略高,因?yàn)檫@里還有存儲的因素,實(shí)際MT8676要比SA8295要高,去年在對座艙芯片排名時(shí),權(quán)重依次為CPU算力、GPU算力、制造工藝、存儲帶寬和AI算力。CPU算力決定座艙系統(tǒng)的流暢程度,GPU算力決定屏幕數(shù)量、分辨率和3D圖形性能,制造工藝越先進(jìn),功耗就能降低更多,存儲帶寬也決定一部分流暢程度,AI算力主要用于自動泊車或本地語音識別,重要性不高,因此排在最后。
上圖同樣也能看出,同樣的主芯片,跑分差別也很大,這主要是受存儲的速度和容量影響,主流的LPDDR4頻率為1600MHz,LPDDR4X是2133MHz,LPDDR5是3200MHz,LPDDR5X有4266MHz和8533MHz兩種,還有LPDDR5T是9600MHz。
整理:佐思汽研
三星的V920也在SA8295之上,目前安兔兔統(tǒng)計(jì)到的總分為1137931,其中CPU成績?yōu)?35814、GPU成績?yōu)?12285、MEM成績?yōu)?09988、UX成績則是179844。GPU成績幾乎是MT8676的兩倍,CPU成績與MT8676差距較大。
根據(jù)安兔兔的資料,MT8676的CPU是8核心設(shè)計(jì),四核心Cortex-A715搭配四核心Cortex-A510的組合,最高主頻2.9GHz,GPU則是Mali-G615 MC6。根據(jù)這個(gè)配置,MT8676有90%的可能是天璣8300的車機(jī)版,兩者的CPU與GPU配置完全相同。天璣8300也是四核心Cortex-A715搭配四核心Cortex-A510的組合,一顆A715運(yùn)行頻率3.35GHz,另外三顆A715運(yùn)行頻率3.2GHz,車機(jī)版要注意功耗,頻率自然降低一些。天璣8300的A510運(yùn)行頻率是2.2GHz,估計(jì)車機(jī)版MT8676是2.0GHz。天璣8300的GPU是六核心Mali-G615,運(yùn)行頻率是1.4GHz,GPU是耗電大戶,估計(jì)車機(jī)版頻率降至700MHz。天璣8300的AI部分是APU 780,MT8676應(yīng)該也是這個(gè)APU。
AI方面,MT8676比SA8295要強(qiáng),因?yàn)镾A8295實(shí)際上是筆記本電腦領(lǐng)域的8cx Gen3,早在2020年底就完成設(shè)計(jì)了,而MT8676的APU780是聯(lián)發(fā)科最新第七代設(shè)計(jì),第六代的APU 690的算力是30TOPS@int8,第七代的APU780支持 8 倍生成式 AI Transformer 算子加速、2 倍整數(shù)運(yùn)算、2 倍浮點(diǎn)運(yùn)算,支持混合精度 INT4 量化技術(shù),具有3.3倍AI 綜合性能(AI Benchmark v5),AI 綜合性能提升 23%。算力估計(jì)是35TOPS@INT8,70TOPS@INT4。
APU780能夠支持端側(cè)運(yùn)行100億參數(shù)AI大語言模型。可以瞬間生成文本和圖像,賦能各家車機(jī)終端實(shí)現(xiàn)生成式AI創(chuàng)新應(yīng)用。
SA8295是比較老的產(chǎn)品,CPU是4核心Cortex-X1和4核心Cortex-A78,落后MT8676大約兩代。
A715支持與ARMv9.0 ISA大致相同的幾項(xiàng)增強(qiáng)功能。更關(guān)鍵的是,A715的所有Exception Level都是僅支持AArch64(完全放棄了 32 位支持)。A715的設(shè)計(jì)原則與之前的大核心相似:以更高的比率提高性能,而不是影響功率和面積。在這次迭代中,性能重點(diǎn)放在了整體改進(jìn)上,而沒有顯著拓寬pipeline或extending its depth。最后,Arm 工程師引入了受早期Cortex-X 設(shè)計(jì)啟發(fā)的有針對性的改進(jìn),例如分支預(yù)測器和預(yù)取增強(qiáng)功能。
A715使用了基本與X3相同的分支預(yù)測器,同樣擁有三級的BTB,但具體配置未知。分支預(yù)測器支持每周期吞吐兩個(gè)條件分支(condition branch)。由于A715取消了arch32支持,decoder的大小減小到了A710的1/4。decoder寬度從4增加到了5,與X3相同,從1.5K的Mops Cache取消了Mops Cache。內(nèi)存系統(tǒng)上,增加了load replay queue的大?。ǖ唧w未知),兩倍了data cache banks提高帶寬,增加了50%的L2 TLB。
圖片來源:ARM
A715相對A710的性能提升微乎其微,但功耗大幅下降。因?yàn)楣谋容^低,所以MT8676中的A715運(yùn)行頻率可以比較高,而SA8295因?yàn)閄1的功耗高,所以頻率不得不大幅度降低到2.5GHz,導(dǎo)致CPU性能不如MT8676。
首先采用MT8676的可能是長安或吉利,SA8295的下一代車規(guī)級座艙芯片目前看來是SA8255,不過SA8255性能低于SA8295,特別是GPU性能。CPU方面也略低于SA8295,倒是AI方面,最高48TOPS。MT8676能否挑戰(zhàn)SA8295,讓我們拭目以待。
免責(zé)說明:本文觀點(diǎn)和數(shù)據(jù)僅供參考,和實(shí)際情況可能存在偏差。本文不構(gòu)成投資建議,文中所有觀點(diǎn)、數(shù)據(jù)僅代表筆者立場,不具有任何指導(dǎo)、投資和決策意見。