GPU(graphics processing unit)已經(jīng)成為現(xiàn)代計算架構(gòu)中不可或缺的組成部分,它最初被用于處理復(fù)雜的圖形和視覺信息,在3D渲染、圖像處理和視頻解碼等領(lǐng)域展現(xiàn)出了卓越性能。
隨著數(shù)據(jù)的爆發(fā)式增長,GPU的并行計算能力得到了深入挖掘,用于更廣泛的計算任務(wù)。這一轉(zhuǎn)變,既標志著GPU架構(gòu)的跨越式演進,也標志著通用計算領(lǐng)域的一個重要里程碑。近年來,全球GPU市場迎來快速發(fā)展。
在這一背景下,國產(chǎn)GPU積極探索在專用圖形加速、通用并行計算領(lǐng)域的發(fā)展,技術(shù)創(chuàng)新、產(chǎn)品性能和市場應(yīng)用都取得了一定的進展。預(yù)計到2027年,我國GPU市場規(guī)模有望達到345.6億美元。
超越圖形,GPU架構(gòu)由專用走向通用
GPU是專門在個人電腦、工作站、游戲機和一些移動設(shè)備(如平板電腦、智能手機等)上做圖像和圖形相關(guān)運算工作的處理器,最初用在PC和移動端上運行繪圖運算工作,與CPU集成,以集成顯卡(核顯)的形態(tài)發(fā)揮功能。
對GPU通用計算進行深入研究從2003年開始,并出現(xiàn)了GPGPU概念,“GP”表示通用目的(General Purpose),GPGPU一般也被稱為通用圖形處理器或通用GPU。NVIDIA于2007年率先推出了獨立GPU(獨顯),使其作為“協(xié)處理器”在PC和服務(wù)器端負責(zé)加速計算,承接CPU計算密集部分的工作負載,同時由CPU繼續(xù)運行其余程序代碼。
在GPU走向通用計算的過程中,統(tǒng)一渲染架構(gòu)的出現(xiàn)非常關(guān)鍵。統(tǒng)一渲染單元是一個高性能的浮點和矢量計算邏輯,它具有通用和可編程屬性。由此,GPU不再有單獨的頂端渲染單元和像素渲染單元,而是由一個通用的渲染單元同時完成頂點和像素渲染任務(wù)。
基于統(tǒng)一渲染架構(gòu),GPU中的可編程計算單元Shader(著色器)core被挖掘出了更多的使用方法,比如通用計算。GPU從若干專用的固定功能單元(Fixed Function Unit)組成的專用并行處理器,進化為以通用計算資源為主、固定功能單元為輔的架構(gòu),這一架構(gòu)的出現(xiàn)奠定了GPGPU的發(fā)展基礎(chǔ)。
不過,雖然都是由GPU架構(gòu)演進而來,但關(guān)注的重點有明顯區(qū)別,GPU的核心價值體現(xiàn)在圖形圖像渲染,GPGPU的重點在于算力。GPGPU架構(gòu)設(shè)計時,去掉了為圖形處理而設(shè)計的硬件加速單元,保留了GPU的SIMT架構(gòu)和通用計算單元,使之更適合高性能并行計算,并能使用更高級別的編程語言,在性能、易用性和通用性上更加強大。
二者各有其技術(shù)和生態(tài)門檻,對于從業(yè)企業(yè)來說,體系結(jié)構(gòu)與算法是核心壁壘。全球GPU專利持有數(shù)量排名前三的是NVIDIA、Intel和AMD,與之相比,我國GPU企業(yè)入局晚、專利數(shù)量少且布局主要在國內(nèi)。
GPU國產(chǎn)之路已開啟
國產(chǎn)GPU于2017年之后進入高投入期,特別是2020年前后,多家創(chuàng)業(yè)公司成立,主要面向圖形渲染和AI計算進行技術(shù)布局。GPGPU代表廠商有海光、壁仞、沐曦、登臨、天數(shù)智芯等,圖形渲染代表廠商有景嘉微、摩爾線程(兩個方向均有布局)、芯動科技等,主要以信創(chuàng)產(chǎn)業(yè)鏈企業(yè)和初創(chuàng)企業(yè)為主。<與非研究院>對國產(chǎn)GPU企業(yè)進行了梳理(附圖見文末)。
1、 國產(chǎn)GPU進入創(chuàng)業(yè)高峰期
與技術(shù)進步、市場需求增長以及政策支持等因素相關(guān),2020年之后,我國GPU進入創(chuàng)業(yè)高峰期。<與非研究院>對主要的國產(chǎn)GPU企業(yè)進行了梳理(附圖見文末)。
從早期探索到快速增長,再到當(dāng)前的創(chuàng)業(yè)高峰期,我國GPU產(chǎn)業(yè)整體呈現(xiàn)出活躍的創(chuàng)新氛圍,目前呈現(xiàn)成熟與新興企業(yè)并存的格局。
2、 國產(chǎn)GPU處于融資活躍期
從已梳理企業(yè)的融資/上市情況來看,處于天使輪前后、A輪前后、B輪前后的企業(yè)數(shù)量最多,這也符合我國GPU產(chǎn)業(yè)當(dāng)前的發(fā)展情況,仍處于相對早期的階段。具體情況見文末附圖。
不過,初創(chuàng)GPU企業(yè)的融資活躍度,也反映出我國GPU產(chǎn)業(yè)正在經(jīng)歷快速成長期。這些處于早期融資階段的企業(yè)通常更加注重技術(shù)創(chuàng)新和投入,這也意味著我國GPU產(chǎn)業(yè)正在積累技術(shù)實力,為未來的突破和成熟打下基礎(chǔ)。同時,GPU產(chǎn)業(yè)尚未形成穩(wěn)定的市場格局,行業(yè)競爭和整合可能會進一步加劇。
3、 國產(chǎn)GPU地域分布較廣
從國產(chǎn)GPU企業(yè)的地域分布來看,正在全國范圍內(nèi)逐漸展開,其中上海7家、武漢3家、南京3家、深圳2家、北京1家、天津1家、長沙1家、珠海1家、西安1家、重慶1家。主要集中在具有科技和經(jīng)濟優(yōu)勢的地區(qū),以一線城市和科技中心為主,總體來看具備一定的地域多樣性(附圖見文末)。
4、產(chǎn)品布局走向多樣化
梳理21家國產(chǎn)GPU企業(yè)的技術(shù)路徑,其中,6家企業(yè)致力于專用架構(gòu)的圖形圖像GPU產(chǎn)品開發(fā),5家專注于通用并行架構(gòu)的GPU開發(fā),10家則是專用+通用并行的產(chǎn)品開發(fā)模式。<與非研究院>對主流的圖形GPU和通用GPU都進行了整理和對比(附圖見文末)。
重點關(guān)注國產(chǎn)GPU三大機遇
1、信創(chuàng)
從2019年我國提出發(fā)展信創(chuàng)產(chǎn)業(yè),到2021年信創(chuàng)開始邁向行業(yè)深水區(qū),逐漸延伸到金融、電信等重點行業(yè)、核心業(yè)務(wù),我國信創(chuàng)產(chǎn)業(yè)規(guī)模持續(xù)擴大。2021年,信創(chuàng)產(chǎn)業(yè)規(guī)模達6886.3億元,近五年復(fù)合增長率為35.7%,預(yù)計2025年有望突破2萬億,其中IT硬件和基礎(chǔ)軟件構(gòu)成的核心市場規(guī)模將達到6920億。
GPU作為信創(chuàng)產(chǎn)業(yè)的核心硬件之一,可為政府、金融、電信等行業(yè)提供自主可控的圖形處理和高性能計算能力。
一方面,國產(chǎn)GPU在信創(chuàng)領(lǐng)域的生態(tài)布局在加強,比如近期智繪微電子的二代桌面顯卡與飛騰騰銳處理器完成兼容性適配認證,表明二者搭配能夠良好運行,為信創(chuàng)國產(chǎn)化應(yīng)用提供良好的計算能力;另一方面,信創(chuàng)領(lǐng)域的新機遇值得關(guān)注,特別是運營商近兩年在服務(wù)器的集采方面,國產(chǎn)化率不斷提升。
從運營商近兩年的投資情況來看,中國移動2023—2024年新型智算中心(試驗網(wǎng))集采項目,12個標包對應(yīng)AI訓(xùn)練服務(wù)器采購量總計達到2454臺(1-11標包集采1204臺,12標包集采1250臺);中國電信2022年至2023年服務(wù)器集采的國產(chǎn)化率約為27%,2023年10月公布的AI算力服務(wù)器(2023年至2024年)集中采購項目評審結(jié)果顯示國產(chǎn)化率約為47%;中國聯(lián)通也已開啟2024年AI服務(wù)器集采,數(shù)量分別為4175臺、2503臺。運營商項目有望為國產(chǎn)GPU企業(yè)帶來更多機會。
隨著越來越多的企業(yè)和機構(gòu)開始數(shù)字化轉(zhuǎn)型,利用數(shù)字技術(shù)來改進運營、增強客戶體驗、創(chuàng)新產(chǎn)品和服務(wù)等,數(shù)字孿生將在這一過程中發(fā)揮重要作用,比如:幫助企業(yè)全面理解和優(yōu)化業(yè)務(wù)流程、進行預(yù)測性維護、提高決策質(zhì)量、加速產(chǎn)品開發(fā)、提升靈活性和適應(yīng)性等等。
在數(shù)字孿生方面,GPU的應(yīng)用機遇主要體現(xiàn)在以下幾個方面:
- 實時渲染能力:GPU提供的實時渲染能力對于創(chuàng)建精確的數(shù)字孿生模型至關(guān)重要。它可以快速生成高質(zhì)量的圖像,使用戶能夠即時看到變化和交互的效果;
- 復(fù)雜場景模擬:數(shù)字孿生經(jīng)常用于模擬復(fù)雜的工業(yè)場景,如生產(chǎn)線、交通系統(tǒng)或城市環(huán)境,GPU的并行處理能力可以高效地處理這些場景中的大量數(shù)據(jù)和復(fù)雜計算;
- 虛擬現(xiàn)實(VR)和增強現(xiàn)實(AR):數(shù)字孿生結(jié)合VR和AR技術(shù),可以提供更加沉浸式的體驗,GPU可提供必要的圖形處理能力;
- 云渲染服務(wù):隨著云計算的發(fā)展,基于云的GPU渲染服務(wù)為數(shù)字孿生提供了更靈活的資源配置和更高的可擴展性。
在這一領(lǐng)域,國產(chǎn)GPU可繼續(xù)提升圖形處理和并行計算能力,為數(shù)字孿生提供技術(shù)基礎(chǔ);加速數(shù)據(jù)分析和可視化過程,提高數(shù)字孿生模型的響應(yīng)速度和精確度;提供性價比更高的解決方案,降低企業(yè)在數(shù)字孿生技術(shù)應(yīng)用中的成本;提升國內(nèi)數(shù)字孿生技術(shù)應(yīng)用的自主可控能力,保障數(shù)據(jù)安全和產(chǎn)業(yè)安全。
3、AI智算
新型智算中心是以高性能GPU、AI加速卡等集群算力為核心,集約化建設(shè)的新型算力基礎(chǔ)設(shè)施。
工信部發(fā)布的《新型數(shù)據(jù)中心發(fā)展三年行動計劃(2021-2023年)》,已經(jīng)明確了算力內(nèi)涵并引入測算指標FLOPS,對數(shù)據(jù)中心發(fā)展質(zhì)量進行評價,行動計劃指出:到2023年底,總算力規(guī)模將超過200 EFLOPS,高性能算力占比將達到10%;到2025年,總算力規(guī)模將超過300 EFLOPS。
六部門發(fā)布的《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計劃》,進一步明確了頂層算力的建設(shè)節(jié)奏。其中提及,2023年至2024年智算建設(shè)缺口為23EFlops,2025年全國算力目標超過300EFlops,智算比例達到35%,智算算力目標為105EFlops。
目前,國內(nèi)在8個地區(qū)建設(shè)國家算力樞紐節(jié)點,并規(guī)劃了10個國家數(shù)據(jù)中心集群,以構(gòu)建國家算力網(wǎng)絡(luò)體系。截至2023年底,國內(nèi)智算中心項目為128個,其中83個項目披露規(guī)模,規(guī)??偤统^7.7萬P。另外,2024年共有39個智算中心項目已投產(chǎn)。
由于GPU更適合處理超大規(guī)模智算中心中AI和機器學(xué)習(xí)所需的計算類型,因此,智算中心的建設(shè)對GPU來說是一個不斷增長的機會。
根據(jù)IDC的《中國半年度加速計算市場(2023全年)跟蹤》報告,2023全年,中國加速服務(wù)器市場規(guī)模達到94億美元,同比2022年增長104%。其中GPU服務(wù)器依然是主導(dǎo)地位,占據(jù)92%的市場份額,達到87億美元。其余NPU、ASIC 和 FPGA等非GPU加速服務(wù)器占據(jù)近8%的市場份額,超過7億美元。
從國際環(huán)境來看,美國對相關(guān)技術(shù)及產(chǎn)品的管控,雖然在一定程度限制了中國AI產(chǎn)業(yè)的發(fā)展,但同時也激發(fā)了中國本土廠商自研芯片的積極性。從市場與產(chǎn)業(yè)鏈角度看,在AI行業(yè)與算力市場不斷發(fā)展的背景下,市場對于AI服務(wù)器的需求不斷增大,將持續(xù)推動AI服務(wù)器的銷量增長,也將帶動國產(chǎn)GPU的落地應(yīng)用。
另一方面,大模型的落地對于AI基礎(chǔ)設(shè)施市場有明顯帶動作用。語音識別、人臉識別、文字生成、圖文創(chuàng)作等應(yīng)用已經(jīng)從研究模型走向落地,大模型應(yīng)用在日常生產(chǎn)生活中的作用越來越明顯?;趯A繑?shù)據(jù)的訓(xùn)練和對模型的不斷調(diào)優(yōu),AI大模型具有更精準的執(zhí)行能力和更強大的場景可遷移性。
2024年,我國政府致力于產(chǎn)業(yè)數(shù)智化轉(zhuǎn)型,AI大模型有望在城市治理、工業(yè)制造、農(nóng)業(yè)生產(chǎn)等綜合場景中廣泛應(yīng)用、并提供更好的方案。
這些大模型廣受關(guān)注的同時,對于訓(xùn)練型AI服務(wù)器的算力提出了更大的要求,以此為目標導(dǎo)向,國產(chǎn)GPU緊抓國產(chǎn)化趨勢,有望開始新一輪高速發(fā)展周期。
總結(jié)
除了信創(chuàng)、數(shù)字孿生、AI智算等領(lǐng)域,國產(chǎn)GPU在游戲、智能駕駛、邊緣計算等領(lǐng)域也前景廣闊。
就游戲來說,比如PC游戲、云游戲等,對GPU的圖形處理能力提出了更高要求,且云游戲需要強大的服務(wù)器端GPU來處理圖形渲染任務(wù),都需要相匹配的GPU計算資源;對智能駕駛而言,大量來自多種傳感器的復(fù)雜計算任務(wù),以及對于深度學(xué)習(xí)模型進行加速準確性和可靠性的訓(xùn)練,都對GPU有一定需求;邊緣計算方面,出于低延遲處理、分布式計算、以及實時的數(shù)據(jù)分析與決策需求,相關(guān)技術(shù)和設(shè)施建設(shè)正在快速發(fā)展和投入。
這些領(lǐng)域都為國產(chǎn)GPU提供了新的增長點和應(yīng)用場景,特別是隨著自主可控的計算需求日益增長,國產(chǎn)化勢在必行,國產(chǎn)GPU需要不斷迭代并提升性能,推動產(chǎn)業(yè)化進程的加速落地。