平頭哥甩出“王炸”芯片設(shè)計平臺,給高性能RISC-V芯片撐場!
智東西8月24日報道,在今日舉辦的2022 RISC-V中國峰會上,平頭哥半導(dǎo)體副總裁孟建熠公布了阿里平頭哥的最新“造芯”力作——無劍600。
這次,平頭哥發(fā)的不是芯片,而是一個高性能RISC-V芯片設(shè)計平臺。它一方面幫助芯片公司降低開發(fā)芯片成本和風(fēng)險,另一方面向第三方IP和基礎(chǔ)軟件公司開放,讓更多資源接入到RISC-V生態(tài)。
“無劍”是劍法的至高境界,也寄予了平頭哥的雄心:通過“授人以漁”,提供軟硬件全棧支持,顯著縮短芯片從研發(fā)到量產(chǎn)的時間,推動更多面向不同行業(yè)的高性能RISC-V芯片出現(xiàn)。
更重要的是,它將長期活躍于終端市場的RISC-V芯片,送上了通往高性能的高速列車。據(jù)孟建熠分享,無劍600已經(jīng)實現(xiàn)與國產(chǎn)開源云端操作系統(tǒng)龍蜥的適配,并成功運行了大型桌面級軟件和基于JAVA的應(yīng)用。
01.“平臺+SoC原型”雙劍出鞘,突圍高性能
近年起勢迅猛的RISC-V,與x86、Arm一起,被業(yè)界并稱為「三大CPU主流架構(gòu)」。因開源開放、靈活、低功耗等特性,RISC-V具備沒有歷史包袱、沒有高昂授權(quán)費用、開發(fā)成本更低、無需擔(dān)憂“斷供”風(fēng)險等優(yōu)勢,被視作發(fā)展自主可控本土芯片生態(tài)的關(guān)鍵路徑之一。
平頭哥在做的事,就是通過軟硬件研發(fā)投入和生態(tài)連接,推動國內(nèi)RISC-V生態(tài)快速壯大。
今天發(fā)布的無劍600,便意在于此。無劍600是一個高性能RISC-V異構(gòu)芯片的軟硬件全棧平臺,擁有高性能、高內(nèi)存帶寬、異構(gòu)計算、人工智能(AI)加速的特點,同時兼具高安全、多模態(tài)感知和軟硬一體的能力。
▲無劍600平臺設(shè)計圖
借助該平臺,開發(fā)者和企業(yè)能夠快速開發(fā)性能更高、主頻更高、內(nèi)存更大、邊緣AI計算能力更強的SoC芯片。無劍600的默認(rèn)處理器是玄鐵C910,即平頭哥在2019年發(fā)布的主頻2.5GHz的高性能RISC-V核。這將RISC-V的商用性能,從1GHz推向2GHz。有何意義?孟建熠打個比方,假如將RISC-V比作跳高運動,原來只能跳1米高度,現(xiàn)在能穩(wěn)定跳2米以上,突破了RISC-V性能的極限。在AI加速方面,無劍600平臺中,最新版的玄鐵C910集成了矢量Vector處理器,支持FP16等新型數(shù)據(jù)類型,并可提供高達4TOPs的Int8 AI算力,方便AI加速類應(yīng)用的開發(fā)。無劍600平臺還重點實現(xiàn)了CPU+XPU異構(gòu)架構(gòu)設(shè)計,從運行功耗、內(nèi)存帶寬和軟件棧方面都進行了優(yōu)化,并支持適配GPU、NPU、VPU、DSP、ASIC等多種不同功能的第三方IP。也就是說,半導(dǎo)體IP公司可以用無劍600來打造RISC-V整體生態(tài)上的能力,下游廠商進入了系統(tǒng)級、體系化的框架,可更高效地開發(fā)芯片。平頭哥基于無劍600平臺成功“打樣”——SoC原型曳影1520。
▲SoC原型曳影1520
這是一顆多模態(tài)AI處理器SoC,內(nèi)置4核玄鐵C910,最高吞吐率4266MT,AI峰值算力達到4TOPS,支持全鏈路安全防護,具有4K視頻處理能力,同時包含豐富的異構(gòu)計算和高速IO資源,軟硬件都已完成應(yīng)用的適配。
開發(fā)者和企業(yè)也可以在定制個性化芯片的同時,先在曳影1520上開發(fā)自己的系統(tǒng),縮短產(chǎn)品從研發(fā)到量產(chǎn)上市的時間。
02.給軟硬協(xié)同打個樣!用RISC-V芯片跑大型桌面級軟件
RISC-V芯片的參數(shù)邁進了高性能的大門,下一步,就是考察實際跑應(yīng)用的表現(xiàn)。在曳影1520上,平頭哥與龍蜥社區(qū)、中科院軟件所PLCT實驗室,聯(lián)合打造從芯片平臺到龍蜥操作系統(tǒng)、再到上層應(yīng)用軟件的全鏈路能力,已首次實現(xiàn)龍蜥Linux操作系統(tǒng)的兼容。
▲基于龍蜥Linux OS的軟硬件全棧平臺
這進一步拓展了RISC-V生態(tài)想象力。龍蜥操作系統(tǒng)(Anolis OS)是一款基于Linux的國產(chǎn)主流開源云計算操作系統(tǒng),定位于服務(wù)器端,支持多種主流芯片架構(gòu)和計算場景。因其豐富、復(fù)雜的軟件棧,龍蜥對芯片的要求非常高,此前在x86、Arm架構(gòu)上都經(jīng)過了全面驗證。
這一次,龍蜥首次對RISC-V提供全面支持。曳影1520幫助RISC-V架構(gòu)搭載更重的操作系統(tǒng)和應(yīng)用,完成了3000多個基礎(chǔ)組件的適配,并首次運行FireFox瀏覽器、LibreOffice等大型桌面級軟件,以及Hexo和Open Rocket等基于NodeJS和JAVA的應(yīng)用,這為更大型應(yīng)用程序的適配奠定了基礎(chǔ)。
▲圖說:無劍600平臺已適配龍蜥OS,并首次運行LibreOffice Writer/Impress/Calc等桌面級軟件
這是無劍600平臺的一小步,但是RISC-V的一大步。全棧適配龍蜥,印證了無劍600平臺能夠適配主流云計算操作系統(tǒng),并凸顯了RISC-V可面向特定領(lǐng)域及應(yīng)用進行深度定制化的軟硬聯(lián)合優(yōu)化能力。
當(dāng)前,無劍600平臺針對的市場主要包括平板、智慧大屏、智能NVR、AR/VR和低速UGV等這類高性能旗艦級的產(chǎn)品,也支持醫(yī)療成像、視頻會議、家用機器人、無人機等中高端應(yīng)用?;跓o劍600平臺現(xiàn)已能運行龍蜥社區(qū)的多種云上應(yīng)用,OpenJDK、NodeJS、Python等上游社區(qū)常見應(yīng)用,以及NCNN等AI應(yīng)用。
03.奪榜權(quán)威AI基準(zhǔn)測試,RISC-V架構(gòu)創(chuàng)新加速端側(cè)AI計算
實現(xiàn)高性能RISC-V芯片,非??简炐酒O(shè)計團隊的功底,尤其體現(xiàn)在算力與內(nèi)存、功耗、成本等多方面之間的平衡把握上。
孟建熠告訴智東西,如今下游合作伙伴已經(jīng)不僅僅滿足于一個硬件IP核,而更加看重軟硬件能否很好融合、在穩(wěn)定性和性能上都做出優(yōu)勢,這些需求的變化正推動市場往軟硬件全棧方案發(fā)展。
以無劍600平臺為例,從RISC-V處理器的指令設(shè)計、微架構(gòu)實現(xiàn)、工具鏈和底層庫的優(yōu)化、操作系統(tǒng)優(yōu)化適配,到應(yīng)用的聯(lián)合調(diào)優(yōu),平頭哥團隊都做了大量艱苦的研發(fā)工作,才在技術(shù)軟件上達到基本穩(wěn)定的量產(chǎn)水平。打磨好這些基本功后,還要配置專業(yè)的團隊,對特定應(yīng)用領(lǐng)域所需的功能進行錘煉。
作為高性能RISC-V處理器的先行者,平頭哥當(dāng)前的策略是通用計算和DSA(領(lǐng)域?qū)S眉軜?gòu))并行演進。
AI加速是當(dāng)前一大主流DSA方向。隨著AI計算在端側(cè)應(yīng)用愈發(fā)普及,AI開發(fā)友好性正成為芯片的一大核心競爭力。國內(nèi)很多硬件加速器已經(jīng)能做到較高的性能,但輸在“用不起來”。而RISC-V的開放性,使其相較于Arm芯片有更大的底層創(chuàng)新和擴展空間,能設(shè)計出更適合跑AI算法的系統(tǒng),并能兼顧到不斷推陳出新的AI算法對靈活可擴展性的要求。
平頭哥正通過矢量擴展和全鏈路軟硬件能力的提升,持續(xù)優(yōu)化其RISC-V處理器的AI加速能力。
今年4月,權(quán)威AI基準(zhǔn)測試MLPerf Tiny V0.7推理性能榜單顯示,基于平頭哥RISC-V處理器的軟硬件聯(lián)合優(yōu)化方案,在視覺喚醒、圖像分類、語音喚醒、異常監(jiān)測等4個典型端側(cè)AI任務(wù)中均取得第一,遙遙領(lǐng)先于第二名。
▲平頭哥在MLPerf Tiny V0.7測試拿下4個第一
平頭哥近兩年也在力推為RISC-V準(zhǔn)備的AI部署工具HHB,它支持各種類型的模型和算法,通過更好地實現(xiàn)AI算子與硬件的適配,幫助開發(fā)者完成AI模型的高效編譯及部署。
據(jù)孟建熠觀察,對于1TOPs以下的端側(cè)AI算力需求,平頭哥現(xiàn)有的RISC-V處理器足以勝任,不需要再額外加專用加速器;對于超過1TOPs的算力需求,平頭哥既提供基于RISC-V的擴展,也支持用戶自定義的第三方AI加速IP。例如在過去兩年,平頭哥與Imagination在GPU和AI方面進行深度合作,已經(jīng)能提供硬件IP到優(yōu)化的軟硬件異構(gòu)計算方案。這也是RISC-V領(lǐng)域最成熟的可量產(chǎn)的方案。
04.推動生態(tài)形成合力,三分天下有其一
孟建熠分享說,未來RISC-V將向3個必然趨勢演進:高性能、軟硬件全棧、更廣的生態(tài)合作。如何構(gòu)建更加繁榮的生態(tài)?儼然是當(dāng)前RISC-V領(lǐng)域最核心的議題。
“統(tǒng)一形成好的生態(tài)是大家做RISC-V的共識。”孟建熠談道,RISC-V不是其它架構(gòu)的革命者,當(dāng)務(wù)之急是證明自己能夠成長起來,發(fā)展出自己的特色,真正成為“三分天下有其一”的架構(gòu)
。RISC-V處理器的作戰(zhàn)陣地,正從中低端IoT市場,擴展對高性能、可靠性有更高要求的云計算、邊緣計算、車載智能計算等應(yīng)用場景。
過去一年,全球RISC-V生態(tài)進展飛速,并出現(xiàn)很多標(biāo)志性事件:在IoT(物聯(lián)網(wǎng))領(lǐng)域的應(yīng)用規(guī)模超過100億顆,中國公司的出貨量占到50%;SPECint性能首次超過10分,進入高性能計算的行列。
平頭哥也收獲了顯赫的戰(zhàn)績:玄鐵處理器已成為國內(nèi)RISC-V領(lǐng)域影響力和市占率最大的處理器,廣泛應(yīng)用于MCU、藍牙、無線、語音、視覺等30多類場景,授權(quán)數(shù)以每年50%的數(shù)量增長。
但相比Arm逾2000億顆芯片的出貨量、幾乎圈入全球主流科技公司的成熟生態(tài),RISC-V在應(yīng)用規(guī)模、行業(yè)滲透率、生態(tài)多樣性上,都還有很長的路要走。
在平頭哥生態(tài)副總裁楊靜看來,應(yīng)用和軟件,對于整個RISC-V生態(tài)的發(fā)展至為關(guān)鍵。這也是平頭哥打造無劍600平臺的用意所在,通過打牢軟硬件全棧地樁和聯(lián)通更多的第三方IP,讓企業(yè)能基于RISC-V開發(fā)出滿足其特定應(yīng)用需求的高性能穩(wěn)定可靠的SoC芯片產(chǎn)品。
平頭哥已實現(xiàn)RISC-V與Anolis、AliOSThings、FreeRTOS、RT-Thread、Linux、安卓等操作系統(tǒng)的適配,并在商業(yè)量產(chǎn)芯片中得到了應(yīng)用。今年4月,平頭哥玄鐵C910處理器成功運行TensorFlow Lite,首次實現(xiàn)了RISC-V在安卓12新系統(tǒng)上的AI支持。孟建熠認(rèn)為,盡管RISC-V的應(yīng)用市場會呈現(xiàn)碎片化特征,但是RISC-V生態(tài)仍然是標(biāo)準(zhǔn)化和統(tǒng)一的。
今天,RISC-V國際基金會正在制定統(tǒng)一標(biāo)準(zhǔn),來推動生態(tài)形成合力。平頭哥也在積極參與其中,已在RISC-V國際基金會中參與了29個技術(shù)方向的標(biāo)準(zhǔn)制定,主導(dǎo)負(fù)責(zé)了10個技術(shù)小組,過去一年向基金會貢獻8篇技術(shù)文章。
再往前走,關(guān)鍵問題是如何將RISC-V架構(gòu)的可擴展性很好發(fā)揮出來,這要求有一個標(biāo)準(zhǔn)化的高性能RISC-V芯片平臺,能夠承載更加厚重的軟件棧,而平頭哥正致力于此。
05.結(jié)語:RISC-V仍在生態(tài)繁榮的前夜
在孟建熠看來,如果將目標(biāo)定為滲透到桌面級或云端,那么RISC-V依然處于生態(tài)繁榮的前夜,要把開發(fā)者生態(tài)培育起來,路還很長,需要全球軟硬件RISC-V開發(fā)者的共同努力。
可以看到,平頭哥打造無劍600平臺的目標(biāo),不是售賣自己的芯片,也不是授權(quán)幾乎單一的標(biāo)準(zhǔn)化處理器IP,而是縱向上面向通用計算和特定領(lǐng)域做軟硬件全棧的適配和優(yōu)化,橫向上擴展對第三方IP的支持,由此降低RISC-V芯片的開發(fā)門檻,來吸引更多的生態(tài)合作伙伴。
這樣的策略,將在幫助RISC-V架構(gòu)進入高性能應(yīng)用的同時,助力芯片產(chǎn)品及應(yīng)用走出多樣性,共同推動RISC-V生態(tài)繁榮。
作者 | 心緣
編輯 | 漠影