隨著數(shù)字時(shí)代的來臨,圖形渲染需求越來越大,GPU的作用日漸凸顯,不管是桌面應(yīng)用、游戲、電影、數(shù)字孿生還是元宇宙,都依賴于圖形處理器GPU做重要的技術(shù)支撐。GPU的核心競爭力體現(xiàn)在什么方面?主要是兩大核心要素:性能先進(jìn)性、計(jì)算生態(tài)壁壘,其中,架構(gòu)創(chuàng)新對于性能的提升具有重要意義。
近年來,在芯片技術(shù)“自主可控”的背景下,GPU已經(jīng)成為熱門的創(chuàng)業(yè)賽道。不過,自主可控可以從兩大維度來看待:一種是購買第三方IP架構(gòu)自研GPU內(nèi)核;一種是GPU的IP架構(gòu)、內(nèi)核都是自研。顯然,只有真正著手于底層的架構(gòu)和內(nèi)核自研,才能在知識產(chǎn)權(quán)和技術(shù)迭代上占有主動(dòng)權(quán)。
國產(chǎn)GPU架構(gòu)“天狼星”出世
日前,一款國產(chǎn)GPU自主架構(gòu)在京發(fā)布,是由中天恒星科技有限公司(Advanced Technology Stellar,簡稱中天恒星/ATS)自主研發(fā)的“天狼星”架構(gòu)。“天狼星”主要有三大技術(shù)優(yōu)勢:
第一、面向億級訂單市場,以獨(dú)立顯卡GPU芯片主流產(chǎn)品為突破口,瞄準(zhǔn)需求廣闊、增長強(qiáng)勁的億級剛需市場,突出性價(jià)比優(yōu)勢;
第二、擁有完全自主知識產(chǎn)權(quán),以清華大學(xué)超過10年研究基礎(chǔ)為依托的自研核心架構(gòu),確保產(chǎn)品迭代自主可控。以基礎(chǔ)理論研究為基礎(chǔ),從數(shù)學(xué)公式推導(dǎo)開始,從架構(gòu)設(shè)計(jì)、算法模型、原理驗(yàn)證、硬件實(shí)現(xiàn)、驅(qū)動(dòng)開發(fā)等環(huán)節(jié)全部正向設(shè)計(jì)。核心架構(gòu)完整知識產(chǎn)權(quán),已申請專利和著作權(quán)數(shù)百項(xiàng),數(shù)十項(xiàng)已獲授權(quán);相關(guān)研究成果發(fā)表于ISCA、Micro、IEEE TPDS、IEEE TCAD等頂級會議和期刊;
第三、完備的交付能力,上下游產(chǎn)業(yè)鏈準(zhǔn)備充分,確保產(chǎn)品量產(chǎn)自主可控;芯片設(shè)計(jì)完成全面驗(yàn)證,確保流片成功;軟硬件接口符合國際標(biāo)準(zhǔn),確保芯片裝機(jī)即可使用,包括操作系統(tǒng)認(rèn)證:Windows WHQL;API認(rèn)證:Open GL Conformance Test;外圍接口認(rèn)證:HDMI DP CTS;專業(yè)測試認(rèn)證:PHY layer和LIINK layer;質(zhì)量體系認(rèn)證:顯卡3C認(rèn)證(中國)、 日本VCCI 、歐盟CE、 美國FCC。
“天狼星”GPU架構(gòu)主要亮點(diǎn)包括:
一是具有3D圖形引擎+2D圖形加速+視頻引擎。
二是自主可控/靈活優(yōu)化的指令集和VLIW/SIMD機(jī)器指令集(ICCD’13);其中,自主可控/靈活優(yōu)化的指令集,保證GPU芯片迭代的軟件兼容。
三是SIMT計(jì)算框架,充分利用圖形應(yīng)用的數(shù)據(jù)并行性( DATE’12.ICCD'13,TVLSI15)。
四是支持物理真實(shí)渲染(ACMComputingSurvey’14,SIGGRAPHASIA'14.15)。
五是Shader Core(Graphics ProcessingCluster),包括SIMT獨(dú)立指令執(zhí)行單元、以32位浮點(diǎn)ALU為基礎(chǔ)的統(tǒng)一圖形架構(gòu)(ICCD13)以及集成寄存器堆、紋理/數(shù)據(jù)緩存。
六是延遲聚集式全局線程調(diào)度技術(shù)(ISCA20、TPDS21、TCAD'21)。
七是具有良好性能伸縮性的片上互聯(lián)架構(gòu)(MICRO'20、TPDS’21)。
據(jù)了解,中天恒星研發(fā)團(tuán)隊(duì)由卡內(nèi)基梅隆大學(xué)電子與計(jì)算機(jī)工程博士、清華大學(xué)軟件學(xué)院、微電子學(xué)研究所副教授、NVIDIA合作教授鄧仰東博士率領(lǐng),是中天恒星聯(lián)合創(chuàng)始人兼總架構(gòu)師。據(jù)介紹,他是GPU通用計(jì)算最早的研究人員之一,長期從事圖形處理器體系結(jié)構(gòu)、并行計(jì)算研究和芯片產(chǎn)品開發(fā)工作;曾設(shè)計(jì)出全球第一個(gè)基于FPGA的GPU仿真平臺;研究成果在ISCA、MICRO、等頂級會議和期刊發(fā)表。鄧仰東博士撰寫了多部教材和專著,其中《數(shù)字集成系統(tǒng)的結(jié)構(gòu)化設(shè)計(jì)與高層次綜合》入選清華大學(xué)及多所大學(xué)研究生教材,《異構(gòu)處理器OpenCL編程導(dǎo)論》是國內(nèi)GPU異構(gòu)計(jì)算第一部教材,《3-Dimensional VLSI》是三維集成電路的第一部專著。
“從0到完整架構(gòu)的實(shí)現(xiàn),都是自主技術(shù)”
“天狼星”架構(gòu)的問世,對打破國外GPU架構(gòu)的壟斷具有重要意義。
當(dāng)前,Imagination和Vivante兩家公司是國內(nèi)GPU產(chǎn)品主要IP來源。中天恒星認(rèn)為,這些IP主要是針對移動(dòng)應(yīng)用的GPU內(nèi)核,不適合桌面應(yīng)用。此外,購買第三方的IP,難以形成成熟的圖形顯卡級GPU,核心電路專利無法自控和自主迭代。
不過,自研GPU架構(gòu)存在極高的門檻,關(guān)鍵挑戰(zhàn)有哪些?鄧仰東指出:“GPU設(shè)計(jì)有幾個(gè)地方非常復(fù)雜:一個(gè)是架構(gòu)級的設(shè)計(jì),這其實(shí)是個(gè)統(tǒng)籌的藝術(shù)。GPU本身的資源,在所謂的uni版的shader,所有的計(jì)算資源是一樣的,大家都用32比特或者64比特的浮點(diǎn)運(yùn)算單元,這是一個(gè)配合的問題。有很多核共享L2的cash,然后每個(gè)核內(nèi)有自身的計(jì)算單元,還有通往片外的各種通道,實(shí)際上片上還有一些針對圖形的,比如像紋理的緩存;這些雖然很容易知道是什么樣的模塊,難的是如何配合起來實(shí)現(xiàn)整體性能最優(yōu)。換言之,如何通過統(tǒng)籌協(xié)調(diào),能夠適應(yīng)絕大多數(shù)圖形應(yīng)用。在大多數(shù)情況下,均衡的設(shè)計(jì)保持性能每秒至少30幀,這是一個(gè)極具挑戰(zhàn)的地方。二是,架構(gòu)仿真的時(shí)間非常長,需要經(jīng)驗(yàn)也需要直覺,去找出架構(gòu)問題到底出在哪里。這方面也是一個(gè)很大的挑戰(zhàn),需要有多年的積累才能去做這件事?!?/p>
“很多國產(chǎn)的GPU的IP授權(quán)主要購買的第三方。中天恒星的路線有所不同,核心的圖形引擎完全自主設(shè)計(jì)的,所以3D圖形引擎這塊不涉及到別人的知識產(chǎn)權(quán),也沒有IP的問題,全部是我們自己擁有,從0到完整架構(gòu)的實(shí)現(xiàn),都是我們自主的技術(shù)。”鄧仰東指出。
為何押注圖形渲染GPU?
GPU主要有圖形渲染和計(jì)算處理兩大功能,而中天恒星主要聚焦于圖形渲染。對此,鄧仰東表示,用于渲染的GPU才是市場主流,占到整個(gè)GPU市場的80%以上。從二者的市場規(guī)模來看也是如此,如2021年全球服務(wù)器出貨量1300萬臺,而PC出貨量3.5億臺左右。一般來說,算力GPU搭載在服務(wù)器中,而每一臺PC都會搭載一塊顯卡,所以從這個(gè)意義上來講,渲染GPU也是主流。
鄧仰東強(qiáng)調(diào),還要關(guān)注一個(gè)更大的可能性——大屏電視目前已經(jīng)非常普及,與大屏電視的交互非常有前景,典型應(yīng)用如游戲等,對GPU將產(chǎn)生更多需求。
此外,從GPU渲染標(biāo)準(zhǔn)的發(fā)展來看,主要是由三大圖形和計(jì)算標(biāo)準(zhǔn)界定的,一是OpenGL,由國際標(biāo)準(zhǔn)化組織1997年推出,之后從2007年開始,OpenGL連出三版,基本上界定了整個(gè)圖形渲染要完成的工作。二是微軟的Direct X,是專門針對Windows環(huán)境的圖形標(biāo)準(zhǔn)。三是OpenCL,最初是針對圖形的純計(jì)算能力,后來延伸到通用計(jì)算。
“這三大標(biāo)準(zhǔn)都在2007-2017年經(jīng)歷了黃金時(shí)代,到2017年基本固化。也就是說今天的圖形標(biāo)準(zhǔn)仍然是2007年主要的圖形顯示內(nèi)容,2007年之后,基本上圖形標(biāo)準(zhǔn)沒有很大變化,GPU要做的剛需工作基本沒有變化。這里就有一個(gè)趕上NVIDIA圖形渲染GPU設(shè)計(jì)的可能性?!编囇鰱|表示。
兩代GPU架構(gòu)發(fā)展脈絡(luò)和規(guī)劃
鄧仰東在介紹“天狼星”架構(gòu)的研發(fā)過程時(shí)提到,前期的研究工作主要在清華大學(xué)進(jìn)行,從2007年開始,包括并行計(jì)算、虛擬指令集的設(shè)計(jì)、GPU的加速仿真、GPU的核心模塊設(shè)計(jì)等等。之后,為了提高仿真速度,他們把傳統(tǒng)軟件仿真搬到FPGA平臺上,2013年,在FPGA平臺上仿真出了整個(gè)GPU架構(gòu),實(shí)現(xiàn)了快速迭代。此后,又進(jìn)行了光線追蹤算法/硬件、片上調(diào)度、片上通信網(wǎng)絡(luò)等研究工作。最后,在這些工作基礎(chǔ)上,發(fā)展出了中天恒星的GPU架構(gòu)。
據(jù)了解,第一代GPU架構(gòu)取名為“天狼星”有著獨(dú)特的寓意。中天恒星創(chuàng)始人黃永博士解釋說:“我們的架構(gòu)全部是以恒星來命名的。Stellar是恒星、星宿的意思,引申出來有“超一流”、“卓越”的含義。第一代叫‘天狼星’,是夜空中肉眼可見的最亮的恒星。第二代架構(gòu)命名為‘大角星’,它是第二亮的恒星。只是因?yàn)榫嚯x地球更遠(yuǎn),所以看起來沒有天狼星亮;實(shí)際上,大角星比天狼星更亮,其亮度是太陽的110倍。
據(jù)悉,中天恒星兩代GPU架構(gòu)的發(fā)展規(guī)劃主要是:第一代“天狼星”架構(gòu)于2019年完成驗(yàn)證,2021年誕生,2023年,第一代“天狼星”架構(gòu)GPU實(shí)現(xiàn)量產(chǎn)。2024年,繼續(xù)優(yōu)化基于“天狼星”架構(gòu)的GPU。第二代GPU架構(gòu)“大角星”于2022年定義,2025年,將量產(chǎn)第二代“大角星”架構(gòu)的GPU。
業(yè)界看好國產(chǎn)GPU顯卡前景
GPU架構(gòu)“天狼星”得到行業(yè)專家的高度認(rèn)可和好評。
對于天狼星架構(gòu),國際信息顯示學(xué)會中國總裁、fellow、俄羅斯工程院外籍院士、國際信息顯示學(xué)會北京分會理事長嚴(yán)群博士指出:“現(xiàn)在所有顯示器都可以稱為被動(dòng)式顯示技術(shù),觀看的人對它的信息傳輸只有接收,沒有互動(dòng),一旦顯示屏加上很多GPU功能,有了沉浸式三維影像呈現(xiàn)、交互體驗(yàn),那就不是傳統(tǒng)的電視了,現(xiàn)在沒有人看電視了,特別是年輕人很少有人看電視,這個(gè)體驗(yàn)已經(jīng)被手機(jī)端、PAD端等便攜設(shè)備全部替代了,沒有必要看那么大的電視。但是一旦需要有交互體驗(yàn)的時(shí)候,我們就會重新回到大屏,重新回到這些有渲染的、真實(shí)的、你可以融入其中的體驗(yàn),這種體驗(yàn)非常不得了?!?/p>
嚴(yán)群博士表示,現(xiàn)在ChatGPT很火,而人工智能還是處于幼兒園、小學(xué)階段,但這已經(jīng)很“可怕”了。如果有了交互,以后靈魂是在數(shù)據(jù)里了,這個(gè)時(shí)候抓取的大數(shù)據(jù),不是Chat生成式了,而是交互式GPT。這個(gè)時(shí)候大數(shù)據(jù)經(jīng)過人工智能的學(xué)習(xí)以后,會遠(yuǎn)遠(yuǎn)超過人類的智力和能力,這是真正元宇宙的目標(biāo)。
上海市集成電路行業(yè)協(xié)會秘書長郭奕武認(rèn)為:“現(xiàn)在正好是非常好的關(guān)口,即產(chǎn)業(yè)革命和新技術(shù)革命的興起,大家也看到包括云計(jì)算、數(shù)字化、智能汽車、云端到邊緣等等,這些產(chǎn)業(yè)化以后,都需要大算力,也就是我們所說的GPU。所以我們趕上的時(shí)機(jī)非常好,未來隨著新的技術(shù)產(chǎn)業(yè)革命的發(fā)展,這個(gè)方面的空間是非常大的?!?/p>
“中天恒星自研架構(gòu),有這幾個(gè)特點(diǎn):一是3D圖形渲染。二是指令集的自主可控,這是非常不容易的。三是它的框架結(jié)構(gòu),包括在整個(gè)儲存器當(dāng)中的DDR4實(shí)現(xiàn)高速存儲,這個(gè)設(shè)計(jì)也是比較領(lǐng)先的架構(gòu),中天恒星都用上了,這決定了未來的產(chǎn)品用途非常廣泛。中天恒星的切入點(diǎn)在顯示領(lǐng)域,我覺得顯示領(lǐng)域非常廣闊,我相信在黃總的帶領(lǐng)下,中天恒星一定會從架構(gòu)到產(chǎn)品,最后能夠使我們的產(chǎn)品在全球落地?!惫任渲赋?。