近年來,隨著智慧城市、自動駕駛、工業(yè)互聯(lián)網(wǎng)等應(yīng)用的廣泛推廣,終端設(shè)備所產(chǎn)生的數(shù)據(jù)量呈爆炸式增長,使得集中式云計算在帶寬負(fù)載、網(wǎng)絡(luò)延時和數(shù)據(jù)管理成本等方面愈加捉襟見肘,由此催生了邊緣計算價值的進(jìn)一步突顯。如今,自動駕駛、工業(yè)自動化、智慧醫(yī)療和物聯(lián)網(wǎng)等各行業(yè)對邊緣計算的需求呈現(xiàn)了大規(guī)模增長態(tài)勢。
隨著邊緣計算應(yīng)用范圍的不斷擴展,數(shù)據(jù)量也持續(xù)增長,于是各行業(yè)對計算量級和實時性提出了更高的要求;而芯片作為算力實現(xiàn)的核心,則成為了整個行業(yè)迫切的需求,市場對于芯片的需求也不再只是單一的算力和功耗,更加強調(diào)芯片的通用性、可編程和可擴展性,以此來滿足不同場景下的應(yīng)用需求。各大芯片廠商也需要不斷創(chuàng)新,研發(fā)更加通用、高性能和高能效的芯片。
逆勢而上,加快國產(chǎn)替代
在通用計算芯片這個成熟市場,強勢的英偉達(dá)、AMD、英特爾三分天下,令后來者難以立足,我國芯片企業(yè)想要撕開一道口子,必須另辟蹊徑;或從架構(gòu)、制造工藝、新型材料、新的器件結(jié)構(gòu)等都要進(jìn)行創(chuàng)新。
在技術(shù)路線方面,成熟的GPU架構(gòu)已經(jīng)存在長達(dá)幾十年之久,形成了比較完整的生態(tài)系統(tǒng)。國內(nèi)雖有多種GPU架構(gòu),但卻缺乏全球競爭力的自主GPU架構(gòu);我國目前GPU產(chǎn)業(yè)發(fā)展呈現(xiàn)兩種趨勢:一是追逐傳統(tǒng)GPU架構(gòu),它的成熟度較高,但是屬于跟隨路線,作為市場的后來者,技術(shù)上不成熟,性能上不先進(jìn)是很難切入市場;二是采用自主研發(fā)的新型架構(gòu),攻堅難度大,但是有取勝的可能性。
智能互聯(lián)世界,GPU架構(gòu)格局或有變化。
珠海市芯動力科技有限公司(簡稱芯動力)創(chuàng)始人指出,為了滿足高效的并行計算,可以采用脈動陣列的方式來處理,同時繼承廣為人們所接受的CUDA語言,這樣可以同時滿足高算力的需求,也不影響用戶的使用習(xí)慣。
經(jīng)過十余年的探索,芯動力研究了并行計算的本質(zhì),發(fā)現(xiàn)了一種更加適合并行計算的處理器架構(gòu),能夠在不改變程序的基礎(chǔ)上更有效的執(zhí)行CUDA語言的程序。并且在2017年成功研發(fā)出可重構(gòu)并行處理器(RPP)架構(gòu)。芯動力開始向GPU領(lǐng)域進(jìn)軍。
RPP架構(gòu)主打并行計算,并且借助于獨有的底層硬件架構(gòu),成功地實現(xiàn)了對CUDA語言的支撐。不僅如此,芯動力還擁有自主開發(fā)的工具鏈,包括獨立的SIMT指令集和后端編譯器,使得其能夠在cuDNN和TensorRT上實現(xiàn)API的兼容,同時也支持廣泛的人工智能框架,如TensorFlow和Pytorch等。
芯動力團(tuán)隊認(rèn)為,通過工具鏈的開發(fā),RPP能夠?qū)τ?a class="article-link" target="_blank" href="/tag/AI/">AI推理的性能進(jìn)行深度優(yōu)化,從而在高性能計算領(lǐng)域中實現(xiàn)了最廣泛使用編程語言的支持。這種兼容不僅從底層的軟件兼容性方面體現(xiàn),同時也可以提升用戶的使用體驗,滿足用戶在調(diào)用形式、使用感知等方面的需求。做這種生態(tài)是因為觀察到CUDA語言體系里,開放體系比較完整,第三方開發(fā)的軟件都是以源代碼的形式開放給社區(qū),而不像CPU的生態(tài)領(lǐng)域里存在大量的二進(jìn)制代碼,因此,支持CUDA語言就能夠廣泛的支持GPGPU的生態(tài)。
并且,以RPP架構(gòu)為基礎(chǔ)面向邊緣市場設(shè)計的第一代芯片RPP-R8已經(jīng)一次性流片成功,芯動力正式開啟踏入GPGPU領(lǐng)域的市場。
據(jù)悉,RPP-R8芯片是一款具備高算力與低功耗的通用型GPGPU芯片,每顆芯片內(nèi)含有1024個計算核,與傳統(tǒng)的GPU架構(gòu)相比,在同樣的算力占用更小的芯片面積,實現(xiàn)了低功耗和高能效的有效平衡。RPP-R8除了具備專用芯片所沒有的通用編程性,面積效率比可達(dá)到同類產(chǎn)品的7~10倍,能效比也超過3倍,可滿足高效并行計算及AI計算應(yīng)用。
GPGPU是GPU未來的重要趨勢之一,也是國產(chǎn)的一次機會。
據(jù)IDC預(yù)測,到2024年,全球邊緣計算市場(包括軟件、硬件和服務(wù))將達(dá)到2506億美元,年增長率為15.9%。其中,中國邊緣計算服務(wù)器市場將達(dá)到855,334臺,硬件價值預(yù)期55億美元。芯動力研發(fā)上市的RPP-R8芯片具備低時延、高算力、低功耗、高能效、編程靈活等諸多優(yōu)勢,非常適用在邊緣計算場景,通過市場的反饋,軟件商可以更快的部署,基本一天就可以完成遷移。
RPP-R8的應(yīng)用從本質(zhì)上可有效幫助企業(yè)降低開發(fā)成本和產(chǎn)品周期,加速產(chǎn)品迭代與擴展。目前這款芯片應(yīng)用場景已覆蓋工業(yè)自動化、智能駕駛、泛安防、物流檢測、內(nèi)容過濾、信號處理等多領(lǐng)域,未來將跨入更廣闊的市場。
當(dāng)前,算力已成為數(shù)字經(jīng)濟時代的核心生產(chǎn)力,隨著信息化、數(shù)字化和智能化進(jìn)一步加快,新一輪的算力革命正在加速啟動。芯動力作為一家專注于研發(fā)新一代可編程通用并行計算芯片的企業(yè),在珠海、深圳、西安、美國都設(shè)立了研發(fā)中心,專注攻關(guān)核心關(guān)鍵技術(shù),加快國產(chǎn)替代,使得算力在技術(shù)層面不斷突破技術(shù)壁壘。
在目前算力增長的時代,很多芯片廠商依賴于先進(jìn)的工藝來實現(xiàn)芯片的高算力, 在中國半導(dǎo)體工藝被嚴(yán)重卡脖子的時代,架構(gòu)的創(chuàng)新顯得尤為重要,以架構(gòu)的創(chuàng)新來替代先進(jìn)工藝所帶來的算力提升是芯動力一直發(fā)展的方向。