文 I 十巷
報(bào)道 I 芯潮IC
ID I xinchaoIC
幾天前,英偉達(dá)和AMD將在中國(guó)暫停銷(xiāo)售高端GPU的消息在芯片圈不脛而走。
美國(guó)證監(jiān)會(huì)文件
根據(jù)美國(guó)證監(jiān)會(huì)文件顯示:這次被限制的不是常規(guī)意義上的GPU顯卡,而是高端的商用芯片。據(jù)了解,該禁令影響了英偉達(dá)的A100和H100芯片以及包含這些技術(shù)的DGX系統(tǒng)和合作伙伴系統(tǒng)制造商使用的HGX平臺(tái);AMD也收到了美國(guó)當(dāng)局的指示,要求停止向中國(guó)和俄羅斯銷(xiāo)售其頂級(jí)GPU芯片MI250。
這些芯片是針對(duì)AI高速運(yùn)算、HPC及數(shù)據(jù)中心場(chǎng)景而研發(fā)的。
然而,GPU“斷供”事件在發(fā)酵中也出現(xiàn)了一絲轉(zhuǎn)機(jī)。9月1日,英偉達(dá)在提交給美國(guó)證券交易委員會(huì)(SEC)的一份文件中宣稱(chēng),已獲得美國(guó)政府批準(zhǔn)豁免,可以在明年3月前進(jìn)行出口以支持A100的美國(guó)客戶(hù);允許在明年9月1日前通過(guò)其香港辦事機(jī)構(gòu)履行A100和H100訂單和物流。
AMD也指出,新規(guī)定或不會(huì)對(duì)其業(yè)務(wù)產(chǎn)生實(shí)質(zhì)性影響。
但盡管如此,新的GPU斷供“風(fēng)波”,再次揪緊了中國(guó)半導(dǎo)體行業(yè)的神經(jīng),也重新揭開(kāi)了本土GPU產(chǎn)業(yè)的傷疤。
慌張背后,再次吹響了加速?lài)?guó)產(chǎn)替代的號(hào)角。
一記GPU組合拳
以上述英偉達(dá)A100和H100 GPU為例,A100芯片是英偉達(dá)2年前發(fā)布的一款3D堆疊芯片,集AI訓(xùn)練和推理于一身,號(hào)稱(chēng)當(dāng)時(shí)全球最大的7nm芯片。
H100則是一款針對(duì)大模型專(zhuān)門(mén)優(yōu)化的產(chǎn)品,今年3月在GTC大會(huì)上才發(fā)布,采用了最新的Hopper架構(gòu)和臺(tái)積電4nm工藝,擁有800億個(gè)晶體管,最大功率800W,用于提升大型AI語(yǔ)言模型、深度推薦系統(tǒng)等。目前H100還未正式進(jìn)入商用。
圖片來(lái)源:anandtech
在中國(guó)市場(chǎng),A100的用戶(hù)包括阿里巴巴、騰訊、百度,這些公司主導(dǎo)著中國(guó)市場(chǎng)的云計(jì)算服務(wù),提供按需計(jì)算和存儲(chǔ),也可以用于企業(yè)為人工智能應(yīng)用編程。此外,英偉達(dá)的其他中國(guó)客戶(hù)還包括聯(lián)想和云計(jì)算及服務(wù)器提供商浪潮集團(tuán)。
可見(jiàn),國(guó)內(nèi)GPU高端場(chǎng)景的GPU應(yīng)用基本上都由英偉達(dá)的A100覆蓋,今年3月份H100發(fā)布時(shí),國(guó)內(nèi)主流廠商也都已經(jīng)預(yù)定。
針對(duì)這些GPU和相關(guān)DGX產(chǎn)品以及AMD產(chǎn)品的許可要求,多位業(yè)內(nèi)人士表示,這是美國(guó)全面限制中國(guó)技術(shù)發(fā)展的組合拳。包括此前美國(guó)限制高端EDA的銷(xiāo)售,以及聯(lián)合半導(dǎo)體設(shè)備和晶圓代工廠,限制中國(guó)的先進(jìn)制程芯片制造等,均旨在全面減慢中國(guó)的發(fā)展,盡量拖慢中國(guó)的發(fā)展速度。
對(duì)此,Truist Securities分析師表示:短期內(nèi),中國(guó)客戶(hù)可能會(huì)轉(zhuǎn)向不受許可證限制的老一代英偉達(dá)芯片;長(zhǎng)期來(lái)看,這一行為將加速中國(guó)GPU芯片廠商的推進(jìn)速度和投資力度,進(jìn)而導(dǎo)致客戶(hù)轉(zhuǎn)向國(guó)內(nèi)供應(yīng)商。
事實(shí)上,我國(guó)高端GPU芯片進(jìn)口從2019年以來(lái)就一直被限制,之前受限制的應(yīng)用場(chǎng)景主要以超算中心為主,企業(yè)和消費(fèi)者在產(chǎn)品端的感知并不強(qiáng)。而這次范圍擴(kuò)大之后,許多互聯(lián)網(wǎng)大廠和服務(wù)器廠商都受到了影響,應(yīng)用場(chǎng)景延伸到了云計(jì)算服務(wù)器、數(shù)據(jù)中心、AI訓(xùn)練等領(lǐng)域。
重壓之下,國(guó)產(chǎn)GPU產(chǎn)業(yè)亟待突圍,目前也已取得了一定成果。
近兩年,國(guó)產(chǎn)初創(chuàng)GPU公司累計(jì)拿下超百億融資——成立剛2年的壁仞科技融資總額超過(guò)50億,摩爾線程一年融資30億,沐曦集成電路第五輪融資10億元,天數(shù)智芯也宣布拿下10億元C輪融資...
巨額融資背后,是資本市場(chǎng)堅(jiān)信國(guó)產(chǎn)GPU未來(lái)的信心和決心。
尤其近段時(shí)間來(lái),國(guó)產(chǎn)GPU廠商除了陸續(xù)獲得大筆融資以外,也在相繼發(fā)布產(chǎn)品進(jìn)展,切實(shí)在產(chǎn)品上取得了一定的突破。
國(guó)產(chǎn)GPU雙線突圍
按照用途,GPU可以分為通用GPU(GPGPU)和渲染GPU兩種。
前者是用在AI深度學(xué)習(xí)和超算上的高性能加速卡;而圖形渲染GPU就是比較傳統(tǒng)的游戲、桌面,做各種圖形化應(yīng)用的GPU顯卡。
在“斷供”消息發(fā)酵之際,與英偉達(dá)、AMD股價(jià)大幅下跌相比,9月1日上午,國(guó)內(nèi)上市的GPU及AI芯片上市公司股價(jià)普遍上漲,寒武紀(jì)股價(jià)大漲20%,景嘉微股價(jià)大漲10%,海光信息大漲16%...
與此同時(shí),一些GPU芯片創(chuàng)新企業(yè)也不忘抓住機(jī)會(huì)釋放訊號(hào)。在剛過(guò)去的2022世界人工智能大會(huì)(WAIC)上,天數(shù)智芯、壁仞科技、瀚博半導(dǎo)體、燧原科技、愛(ài)芯元智等國(guó)內(nèi)一眾GPU新貴芯片廠商悉數(shù)到場(chǎng),宣布其最新成果和行業(yè)動(dòng)態(tài)。
GPGPU市場(chǎng)火熱
先來(lái)看GPGPU市場(chǎng)。
當(dāng)前,云端需求和應(yīng)用多樣,既要做訓(xùn)練又要做推理,因此要求訓(xùn)練芯片要具備強(qiáng)大的單芯片計(jì)算能力,基本是GPGPU的天下。
GPGPU不具備圖形處理能力,主要是用來(lái)計(jì)算原本由CPU處理的通用計(jì)算任務(wù),實(shí)現(xiàn)一些AI訓(xùn)練和推理等方面的加速運(yùn)算。
從市場(chǎng)現(xiàn)狀來(lái)看,目前中國(guó)90%的GPGPU市場(chǎng)都被英偉達(dá)壟斷。目前國(guó)產(chǎn)GPU廠商中,在這一方面發(fā)力的主要有天數(shù)智芯、瀚博半導(dǎo)體、璧仞科技等廠商發(fā)展較為迅速,正在快速布局積極追趕。
在今年WAIC上,天數(shù)智芯面市了其首款7nm制程的云端推理通用GPU產(chǎn)品“智鎧100”,該芯片已于今年5月點(diǎn)亮,將于2022年第四季度正式發(fā)布,年底量產(chǎn)。智鎧100正在進(jìn)行第一批客戶(hù)的驗(yàn)證和適配。
此外,基于天數(shù)智芯首款GPGPU天垓100芯片的加速卡“天垓100”亮相于去年WAIC上。截至目前,“天垓100”累計(jì)訂單金額已經(jīng)超過(guò)2.3億,觸達(dá)客戶(hù)300多家,其中有意向簽約的客戶(hù)有200多家,覆蓋行業(yè)超過(guò)20個(gè),正在被推廣到各式各樣的互動(dòng)場(chǎng)景中。天數(shù)智芯CTO呂堅(jiān)平表示,天數(shù)智芯100%客戶(hù)都是英偉達(dá)的客戶(hù),公司接下來(lái)目標(biāo)是先拿下英偉達(dá)在國(guó)內(nèi)10%的市場(chǎng)份額。
至此,天數(shù)智芯成為國(guó)內(nèi)唯一同時(shí)擁有GPU架構(gòu)下云端訓(xùn)練+推理完整解決方案的公司。
緊隨其后,云端AI芯片公司瀚博半導(dǎo)體在發(fā)布會(huì)上預(yù)覽了其首款7nm云端GPU芯片SG100,將圖形渲染加入其產(chǎn)品布局。
據(jù)介紹,SG100具備業(yè)界領(lǐng)先的圖形渲染性能,擁有超高吞吐、超高質(zhì)量、低延時(shí)編碼等能力,集渲染、AI、視頻于一體,可為云游戲、云計(jì)算等元宇宙關(guān)鍵性應(yīng)用場(chǎng)景提供深度優(yōu)化。同時(shí),SG100還提供SR-IOV虛擬化支持,端到端整體提升用戶(hù)視覺(jué)體驗(yàn),能夠滿(mǎn)足市場(chǎng)對(duì)智能視頻視覺(jué)、圖形圖像處理的算力需求。目前該芯片還未正式發(fā)布。
去年,瀚博半導(dǎo)體發(fā)布了面向云端的通用AI推理芯片SV102芯片,其特點(diǎn)是推理性能高(單芯片INT8峰值計(jì)算能力200TOPS,還支持FP16/BF16數(shù)據(jù)類(lèi)型),延遲低,視頻解碼性能。支持64路1080p(解碼格式支持H.264、H.265、AVS2)。
SV102芯片中有專(zhuān)門(mén)的硬件視頻解碼單元,其視頻處理和深度學(xué)習(xí)推理的性能指標(biāo)比現(xiàn)有主流數(shù)據(jù)中心GPU高出數(shù)倍,可應(yīng)用于云和邊緣解決方案,節(jié)省設(shè)備投資,降低運(yùn)營(yíng)成本。
在一眾國(guó)產(chǎn)GPU廠商中,壁仞科技算得上對(duì)標(biāo)英偉達(dá)較為突出的一個(gè)。
8月10日,成立僅2年時(shí)間的壁仞科技就推出了首款通用GPU產(chǎn)品BR100系列,采用7nm制程,并創(chuàng)新性應(yīng)用Chiplet與2.5D CoWoS封裝技術(shù),創(chuàng)出全球算力紀(jì)錄。據(jù)透露,其16位浮點(diǎn)算力達(dá)到1000T以上、8位定點(diǎn)算力達(dá)到2000T以上,單芯片峰值算力達(dá)到PFLOPS級(jí)別,以“每秒1千萬(wàn)億次的計(jì)算”算力紀(jì)錄,超過(guò)了英偉達(dá)目前在售的旗艦計(jì)算產(chǎn)品A100 GPU的3倍,強(qiáng)勢(shì)對(duì)標(biāo)英偉達(dá)H100。
壁仞科技BR100與英偉達(dá)A100性能參數(shù)對(duì)比(圖源:路透社)
目前BR100已流片回來(lái),正在進(jìn)行可靠性、穩(wěn)定性等一系列測(cè)試,屬于風(fēng)險(xiǎn)期小規(guī)模量產(chǎn)階段,這個(gè)過(guò)程業(yè)內(nèi)普遍需要9個(gè)月,但壁仞希望能在年底前完成,真正開(kāi)始商用量產(chǎn)。
圖源:芯潮IC
此外,昆侖芯科技、燧原科技、寒武紀(jì)、登臨科技、沐曦集成電路、芯瞳半導(dǎo)體等國(guó)產(chǎn)GPU/AI芯片廠商也在緊鑼密鼓的進(jìn)行研發(fā)布局,加速?lài)?guó)產(chǎn)GPGPU和AI芯片的發(fā)展進(jìn)程。
渲染GPU躍躍欲試
當(dāng)前,我們正在進(jìn)入“一切需要可視化”的時(shí)代,圖形可視化對(duì)于渲染GPU市場(chǎng)的需求增長(zhǎng)迅速。
這幾年,在諸多企業(yè)的努力下,除了最近上述企業(yè)在GPGPU方面的進(jìn)展,國(guó)產(chǎn)GPU廠商在圖形渲染GPU方面也在爭(zhēng)分奪秒的交出有實(shí)力的產(chǎn)品。
在圖形GPU領(lǐng)域,國(guó)內(nèi)以芯動(dòng)科技、格蘭菲、景嘉微、摩爾線程等為代表的企業(yè)為主力。
芯動(dòng)科技
最近幾年,芯動(dòng)科技將業(yè)務(wù)拓展至新賽道,著手GPU研發(fā),目前是基于Imagination的GPU架構(gòu)自主開(kāi)發(fā),同時(shí)采用全套自研高性能IP。和蘋(píng)果公司一樣,芯動(dòng)在架構(gòu)授權(quán)的基礎(chǔ)上不斷優(yōu)化GPU內(nèi)核,現(xiàn)已完整獨(dú)立掌握了GPU內(nèi)核演進(jìn)架構(gòu)圖,實(shí)現(xiàn)了自己的GPU架構(gòu)把控,并將以每年發(fā)布兩款GPU的速度迭代演進(jìn)。
去年,聚焦于數(shù)據(jù)中心、服務(wù)器領(lǐng)域的“風(fēng)華1號(hào)”GPU正式發(fā)布,實(shí)現(xiàn)了國(guó)產(chǎn)5G數(shù)據(jù)中心服務(wù)器GPU應(yīng)用場(chǎng)景從0到1的突破。
據(jù)了解,“風(fēng)華1號(hào)”顯卡實(shí)現(xiàn)了多項(xiàng)第一,如第一款渲染能力達(dá)到5T-10T FLOPS的國(guó)產(chǎn)GPU顯卡,第一款圖形API達(dá)到OpenGL4.0以上,并能實(shí)際演示4.0 benchmark的GPU,還是第一款支持多路渲染+編解碼+AI服務(wù),硬件虛擬化和Chiplet可延展的國(guó)產(chǎn)GPU等。
從芯片算力性能來(lái)看,“風(fēng)華1號(hào)”雙芯片B卡FP32浮點(diǎn)性能達(dá)到10T FLOPS,可以對(duì)標(biāo)英偉達(dá)Tesla T4 GPU(FP32 / 8.1T FLOPS),且功耗更低。此外,風(fēng)華GPU還搭載了Chiplet、GDDR6X以及虛擬化解決方案等眾多優(yōu)勢(shì)技術(shù),為產(chǎn)品提供賦能。
今年8月,芯動(dòng)科技又推出了針對(duì)于桌面市場(chǎng)的“風(fēng)華2號(hào)”GPU,“風(fēng)華2號(hào)”渲染能力突出,GPU像素填充率48GPixel/s,F(xiàn)P32單精度浮點(diǎn)性能1.5TFLOPS,AI運(yùn)算(INT8)性能12.5TOPS,實(shí)測(cè)功耗4至15W,支持OpenGL4.3、DX11、Vulkan等API。
作為參照,就像素填充速率和FP32來(lái)說(shuō),風(fēng)華2號(hào)和英偉達(dá)GT1050大致處于同一檔(GT1050像素填充速率為43.3 GPixel/s,F(xiàn)P32為1.862 TFLOPS,TDP為75W)。
芯動(dòng)科技指出,“風(fēng)華2號(hào)”是賦能桌面生態(tài)鏈的開(kāi)始,將拉開(kāi)風(fēng)華系列GPU走向大眾市場(chǎng)的序幕。目前“風(fēng)華3號(hào)”已基本完成研發(fā),將為國(guó)內(nèi)用戶(hù)提供超大算力光追等酷炫性能;同時(shí),GPGPU和座艙產(chǎn)品也正與客戶(hù)定義中,未來(lái)更多定制計(jì)算產(chǎn)品線將接踵而至。
格蘭菲
格蘭菲是兆芯GPU部門(mén)獨(dú)立出去,同時(shí)吸引投資人入股成立的GPU公司,其技術(shù)源自2000年VIA收購(gòu)的S3,走的是“技術(shù)引進(jìn)-消化吸收-再創(chuàng)新”的路子。
格蘭菲最新的顯卡是Arise-GT10C0,是一款為桌面、商業(yè)顯示以及通用計(jì)算等中高端應(yīng)用場(chǎng)景,研發(fā)設(shè)計(jì)的第一款圖形和圖像獨(dú)顯芯片。其單精度浮點(diǎn)性能為1.5TFlops,GPU像素填充率48GPixel/s,主頻500Mhz,工藝28nm,TDP為45W,支持DX11和OpenGL4.5、Vulkan等API。
從以上參數(shù)可以看出,Arise-GT10C0的規(guī)格看起來(lái)與風(fēng)華2號(hào)相似,但功耗比風(fēng)華2號(hào)GPU高上不少。
目前,對(duì)于格蘭菲GPU的底層架構(gòu)了解的不多,該公司沒(méi)有透露GPU內(nèi)核數(shù)量和時(shí)鐘速度等基本規(guī)格。據(jù)報(bào)道,Arise-GT10C0顯卡對(duì)標(biāo)的應(yīng)該是Intel Arc A380、AMD Radeon RX6400和英偉達(dá)GeForce GTX 1630 等獨(dú)立顯卡。然而,格蘭菲在 FP32 模式下的 28nm GPU 只能與老式的 GTX750Ti 或AMD Vega 8集成顯卡競(jìng)爭(zhēng)。
兆芯
在核顯級(jí)GPU領(lǐng)域,兆芯2019年發(fā)布了兆芯KX-6000,其核顯與S3的C645規(guī)格和性能類(lèi)似,甚至連驅(qū)動(dòng)都能共用,3Dmark成績(jī)?yōu)?50分左右,當(dāng)時(shí)集成的是C-960 GPU。
近日,有網(wǎng)站曝光了兆芯KX-6000G處理器的相關(guān)測(cè)試結(jié)果。3DMark顯示,這款尚未發(fā)布的處理器集成了高性能的格蘭菲Arise-GT10C0芯片,3Dmark成績(jī)?yōu)?000分左右,相較于KX-6000提升了3倍,這個(gè)成績(jī)和英偉達(dá)2012年發(fā)布的GT630差不多,性能作為核顯是足夠了,特別是當(dāng)下黨政辦公Wintel電腦的獨(dú)顯也就這個(gè)水平。
兆芯KX-6000G與英偉達(dá)GT630跑分比較
(圖源:快科技)
景嘉微
景嘉微是中國(guó)第一家成立的GPU公司,產(chǎn)品主要分為圖形圖像處理系統(tǒng)、小型雷達(dá)系統(tǒng)、GPU芯片。
目前,景嘉微的最新GPU產(chǎn)品是JH920,是繼JM5400、JM7200之后的第三代GPU,該芯片采用14nm工藝,支持OpenGL4.0、OpenCL 3.0、Vulkan 1.1等,但不支持DX。關(guān)鍵指標(biāo)上,JH920像素填充率為32G Pixels/s,F(xiàn)P32浮點(diǎn)性能為1.5Tflops,功耗為30W。
從參數(shù)來(lái)看,JH920的性能與英偉達(dá)2016年發(fā)布的GTX1050相仿,GTX1050大概為英偉達(dá)10系顯卡中的入門(mén)級(jí)產(chǎn)品,遜色于風(fēng)華2號(hào)和Arise-GT10C0。
幾個(gè)月前,景嘉微宣布其JM9系列第二款圖形處理芯片已經(jīng)完成了流片和封裝,正在進(jìn)行測(cè)試工作。根據(jù)測(cè)試效果來(lái)看,這款顯卡的性能可以滿(mǎn)足游戲、作圖渲染等需求。
摩爾線程
另一邊,成立于2020年的初創(chuàng)企業(yè)摩爾線程發(fā)展迅速,僅用18個(gè)月時(shí)間就發(fā)布了全新統(tǒng)一系統(tǒng)架構(gòu)MUSA和全能GPU產(chǎn)品“蘇堤”等系列新品,宣稱(chēng)完成了首顆國(guó)產(chǎn)全功能GPU的研制,紙面算力相當(dāng)于2016年推出的英偉達(dá)GTX 1070。
據(jù)了解,摩爾線程的蘇堤芯片是多功能GPU,不單只是有圖形渲染引擎,還具備有多媒體引擎、AI計(jì)算加速,以及物理仿真與科學(xué)計(jì)算引擎,這可以滿(mǎn)足更加廣泛和不同平臺(tái)的多元算力需求。
在實(shí)際的顯卡產(chǎn)品方面,摩爾線程還同步推出了MTT S60和MTT S2000兩款桌面級(jí)的獨(dú)立顯卡,其中MTT S60是面向PC和工作站的,MTT S2000則是專(zhuān)為數(shù)據(jù)中心打造的。
目前摩爾線程已與浪潮、聯(lián)想、清華同方等服務(wù)器OEM達(dá)成合作。
圖源:芯潮IC
另外,從事CPU研發(fā)的龍芯也開(kāi)始切入這個(gè)賽道,正在不斷增強(qiáng)國(guó)內(nèi)GPU企業(yè)的整體研發(fā)實(shí)力。
綜合來(lái)看,雖然上述廠商取得了一系列進(jìn)展和突破,整體而言國(guó)產(chǎn)GPU的現(xiàn)狀并不算樂(lè)觀,雖然在特殊領(lǐng)域算是可以滿(mǎn)足自給自足的需求,但是在中高端領(lǐng)域及個(gè)人消費(fèi)領(lǐng)域還有著不小的差距。
要全面取代英偉達(dá)和AMD的GPU,不管是AI/FP還是渲染,目前還是不現(xiàn)實(shí)的。規(guī)格參數(shù)雖然能夠一定程度上反映GPU的性能,但實(shí)際體驗(yàn)并不一定就與規(guī)格參數(shù)劃等號(hào)。GPU核心設(shè)計(jì)能力不足和API支持不足,或是驅(qū)動(dòng)方面的問(wèn)題,都會(huì)導(dǎo)致GPU規(guī)格與體驗(yàn)倒掛的情況。
GPU是典型入門(mén)容易畢業(yè)難的行業(yè)。近期英特爾時(shí)隔20多年重回獨(dú)立GPU市場(chǎng),拉開(kāi)架勢(shì)發(fā)布的新品,表面看疊了不少buff,實(shí)際到了最考驗(yàn)功底的驅(qū)動(dòng)程序方面,卻被英偉達(dá)按在地上摩擦。所以對(duì)于新品牌的顯卡來(lái)說(shuō),參數(shù)的意義往往有限,紙面上的數(shù)據(jù)最終需要市場(chǎng)來(lái)檢驗(yàn)。
不過(guò)從中低端切入,再慢慢向高端滲透,最終進(jìn)行取代,也是國(guó)產(chǎn)廠商們這么多年一直在走的路線,盡管現(xiàn)在還不行,但風(fēng)波之下,確實(shí)也給國(guó)產(chǎn)GPU提供了一個(gè)機(jī)遇,帶來(lái)了新的擴(kuò)張機(jī)會(huì)。
不過(guò),國(guó)產(chǎn)GPU仍前路漫漫,道路曲折,充滿(mǎn)挑戰(zhàn)。
國(guó)產(chǎn)GPU還要翻越幾重山?
IP困境
IP的質(zhì)量很大程度上決定了國(guó)產(chǎn)GPU性能的底色。
但由于IP研發(fā)難度大、開(kāi)發(fā)周期長(zhǎng),目前中國(guó)GPU開(kāi)發(fā)者大多使用Imagination提供的IP,GPU作為高性能的大芯片,想在短期內(nèi)出成果,快速推出相關(guān)產(chǎn)品,必然需要依賴(lài)外部IP。
簡(jiǎn)單來(lái)說(shuō),就是購(gòu)買(mǎi)一個(gè)商用GPU IP,然后自行修改迭代,如果IP供應(yīng)商終止合作,那么就會(huì)面臨研發(fā)、生產(chǎn)中斷等問(wèn)題。目前國(guó)內(nèi)主流的GPU企業(yè)中,有不少都是采用的商用IP授權(quán),只有景嘉微、天數(shù)智芯等少數(shù)企業(yè)有自研架構(gòu)的GPU產(chǎn)品。
國(guó)內(nèi)GPU底層技術(shù)空白點(diǎn)較多,IP大多受制于國(guó)外廠商,產(chǎn)品前端穩(wěn)定性不理想,目前又很難在主線中高端電子產(chǎn)品上得到普及化應(yīng)用,需多年沉淀形成自主IP積累才能具有一定替代性。
有聲音表示,國(guó)內(nèi)核心IP能力至少比英偉達(dá)、AMD等落后十年左右。而整體而言,GPU企業(yè)與國(guó)際大廠技術(shù)差距約3年,渲染GPU與國(guó)際大廠差距約10年左右。
軟件門(mén)檻
有業(yè)內(nèi)人士指出,計(jì)算芯片最大的門(mén)檻其實(shí)不是硬件,而是軟件。如果一個(gè)芯片沒(méi)有與之配套的軟件生態(tài),則很難真的形成大面積的應(yīng)用,而這其實(shí)也是許多國(guó)內(nèi)GPU公司的產(chǎn)品難以獲得客戶(hù)認(rèn)可的原因所在。
英偉達(dá)當(dāng)前競(jìng)爭(zhēng)優(yōu)勢(shì)的形成,可以回溯到十幾年前黃教主制定的戰(zhàn)略,硬件領(lǐng)先競(jìng)爭(zhēng)對(duì)手至少一個(gè)代際差距,軟件做生態(tài)、建護(hù)城河。
據(jù)了解,2021年英偉達(dá)僅在顯卡驅(qū)動(dòng)測(cè)試工作上的投入就高達(dá)180萬(wàn)小時(shí)。而多年近乎壟斷的行業(yè)地位,形成了很強(qiáng)的生態(tài)效應(yīng),讓軟件開(kāi)發(fā)商更愿意為N卡進(jìn)行針對(duì)性適配。
在當(dāng)前GPU生態(tài)中,軟件的權(quán)重已越來(lái)越高。Imagination中國(guó)區(qū)戰(zhàn)略市場(chǎng)與生態(tài)副總裁時(shí)昕博士曾表示,GPU軟件極為復(fù)雜,包括各種圖形API和計(jì)算接口、基礎(chǔ)庫(kù)、與上層應(yīng)用對(duì)接適配等等,開(kāi)發(fā)工作量巨大。國(guó)內(nèi)GPU生態(tài)的發(fā)展更需要“眾人拾柴”,要加快打造國(guó)產(chǎn)GPU產(chǎn)業(yè)鏈,下游的整機(jī)廠商需要對(duì)國(guó)產(chǎn)GPU給予更多包容。
生態(tài):強(qiáng)者恒強(qiáng)
對(duì)于國(guó)產(chǎn)GPU來(lái)說(shuō),產(chǎn)品如何實(shí)現(xiàn)規(guī)?;逃茫罱▏?guó)產(chǎn)GPU生態(tài)同樣是一個(gè)難題。
如果說(shuō)砸錢(qián)可以買(mǎi)到IP,可以買(mǎi)到最先進(jìn)的工藝,靠堆核心面積可以做出和英偉達(dá)類(lèi)似性能的GPU,但是生態(tài)體系沒(méi)有10年以上積累是做不起來(lái)。
所謂生態(tài),是指硬件架構(gòu)和軟件架構(gòu)相互匹配。經(jīng)過(guò)多年發(fā)展,英偉達(dá)已經(jīng)構(gòu)建了完整的技術(shù)生態(tài),包括四層技術(shù)棧:硬件、系統(tǒng)軟件、軟件平臺(tái)、應(yīng)用框架。除了性能超強(qiáng)的芯片,英偉達(dá)為客戶(hù)提供了快速實(shí)現(xiàn)AI模型訓(xùn)練和部署的軟件系統(tǒng),而且將主流AI算法模型通通開(kāi)源,企業(yè)假如對(duì)某個(gè)AI算法缺乏積累,可以直接免費(fèi)下載英偉達(dá)現(xiàn)成的先進(jìn)模型,稍做調(diào)整就能落地應(yīng)用。
開(kāi)發(fā)者都是慣性的,尤其是在軟件生態(tài)上,用戶(hù)的使用體驗(yàn)已經(jīng)形成,想要輕易移植難度很大。由于英偉達(dá)等國(guó)外龍頭推出GPU時(shí)間更長(zhǎng),長(zhǎng)期使用國(guó)外GPU的廠商出于慣性也不會(huì)突然更換國(guó)產(chǎn)GPU。
另一方面,ICViews在采訪中指出:目前國(guó)產(chǎn)GPU在相同性能下,由于出貨規(guī)模較小,導(dǎo)致價(jià)格更貴。在消費(fèi)級(jí)市場(chǎng),無(wú)法有效降低成本的國(guó)產(chǎn)芯片,往往價(jià)格偏高。不過(guò),在更看重安全性和可靠性的企業(yè)級(jí)GPU市場(chǎng),以及需要自主可控產(chǎn)品的一些行業(yè),不存在C端那種明顯的生態(tài)壟斷,是國(guó)產(chǎn)GPU率先突圍的賽道。
芯片的成功和成熟需要大量的驗(yàn)證和出貨,而找到可持續(xù)的落地場(chǎng)景才是長(zhǎng)期發(fā)展的關(guān)鍵驅(qū)動(dòng)力。
市場(chǎng)認(rèn)可度
另一方面還在于市場(chǎng)的接受度,在之前國(guó)外高端GPU芯片購(gòu)買(mǎi)暢通的時(shí)候,國(guó)內(nèi)芯片很難受到客戶(hù)的認(rèn)可,大家普遍的選擇都是購(gòu)買(mǎi)最先進(jìn)、穩(wěn)定的產(chǎn)品。
而國(guó)外先進(jìn)GPU受到限制之后,也在提醒國(guó)內(nèi)客戶(hù)重新考慮外部的實(shí)際情況,從而也給國(guó)產(chǎn)GPU企業(yè)進(jìn)入客戶(hù)供應(yīng)鏈提供了一次機(jī)會(huì)。
對(duì)此,百度資深系統(tǒng)工程師表示:“之前國(guó)產(chǎn)GPU有30%的性能提升可能都不會(huì)考慮,現(xiàn)在有30%的性能差距可能都不是問(wèn)題了,畢竟刀架在脖子上,先用上再說(shuō)。”
整體來(lái)說(shuō),GPU的研發(fā)牽一發(fā)而動(dòng)全身,需要的不僅僅是企業(yè)的架構(gòu)迭代與升級(jí),還需要制造設(shè)備、材料、EDA軟件等一系列配套產(chǎn)業(yè)的同步提升,才能縮短國(guó)產(chǎn)GPU與國(guó)際領(lǐng)先水平之間的差距。
目前,國(guó)產(chǎn)GPU在危機(jī)之下,正在醞釀新的生機(jī)。
結(jié)語(yǔ)
GPU是一個(gè)高技術(shù)含量的賽道,是一項(xiàng)系統(tǒng)工程,包含硬件架構(gòu)、算法、軟件生態(tài)等多個(gè)組成,缺一不可。我國(guó)在這一領(lǐng)域已經(jīng)落后許久,盡管近年來(lái)突然開(kāi)始有不少初創(chuàng)公司踏足GPU領(lǐng)域,并受到資本青睞,但想要徹底打破GPU壟斷也絕非易事。
目前,雖然很多國(guó)產(chǎn)GPU廠商的紙面數(shù)據(jù),已經(jīng)可以和英偉達(dá)2016年前后的10系產(chǎn)品掰掰手腕,但在調(diào)試以及軟件適配方面的差距,不是一朝一夕就可以完成的。
GPU芯片技術(shù)具有很強(qiáng)的馬太效應(yīng),在芯片行業(yè),領(lǐng)先者與跟隨者的差距缺的不是資本,而是技術(shù)洞察、戰(zhàn)略規(guī)劃、還有超過(guò)十年時(shí)間的落地執(zhí)行。
這片巨大的市場(chǎng),目前正吸引著越來(lái)越多資本的涌入,國(guó)內(nèi)投資GPU的熱潮既是商業(yè)化的需求,也是國(guó)家戰(zhàn)略替代的需求,給國(guó)產(chǎn)GPU的發(fā)展添了一把火。
不過(guò),也有觀點(diǎn)強(qiáng)調(diào):“我們也不能忽視這背后的投機(jī)屬性。一方面,一些GPU新勢(shì)力尚沒(méi)有明確自己的細(xì)分市場(chǎng),沒(méi)有想清楚未來(lái)長(zhǎng)遠(yuǎn)的發(fā)展方向,還只是停留在PPT階段,所以盡管熱度高漲,但真正能用產(chǎn)品說(shuō)話的企業(yè)還較少,尤其是高性能商業(yè)化的渲染GPU產(chǎn)品鳳毛麟角;另一方面,GPU技術(shù)門(mén)檻高,長(zhǎng)期被國(guó)外行業(yè)霸主壟斷,新勢(shì)力想要生存必須掌握核心技術(shù),有多年的技術(shù)積累和人才資金供給。”
總的來(lái)看,如今的GPU市場(chǎng)略顯浮躁,很多初創(chuàng)公司通過(guò)競(jìng)相融資來(lái)“秀肌肉”,像極了通過(guò)比拼燒錢(qián)來(lái)爭(zhēng)勝負(fù)的互聯(lián)網(wǎng)公司。但燒錢(qián)模式是難以為繼的,通過(guò)燒錢(qián),遲早會(huì)燒出越來(lái)越大的窟窿。
每一個(gè)硬件公司、芯片公司,只有保持良性正循環(huán),只有踏踏實(shí)實(shí)服務(wù)客戶(hù),服務(wù)市場(chǎng),并且能夠不斷的回收研發(fā)成本,進(jìn)一步實(shí)現(xiàn)創(chuàng)新,不斷通過(guò)一個(gè)勝利來(lái)贏得下一個(gè)勝利,才是國(guó)產(chǎn)GPU的成功之路。
長(zhǎng)遠(yuǎn)來(lái)看,GPU領(lǐng)域要面臨一定程度洗牌,國(guó)產(chǎn)GPU將在競(jìng)爭(zhēng)中將會(huì)逐漸由多家公司收斂成屈指可數(shù)的幾家公司,那個(gè)時(shí)候才是真正的國(guó)產(chǎn)替代、縮小差距的開(kāi)始。
道阻且長(zhǎng)的國(guó)產(chǎn)GPU賽道,在市場(chǎng)、政策和資本的推動(dòng)下,正在百花齊放,在危機(jī)中尋找生機(jī),或?qū)⒂瓉?lái)發(fā)展的黃金時(shí)代。