作者|Jimmy&淺土&大藍(lán)
當(dāng)?shù)貢r(shí)間6月13日,CPU和GPU領(lǐng)域的“千年老二”AMD舉行了新品發(fā)布會(huì),推出最新強(qiáng)悍GPU,叫板GPU老大英偉達(dá)。
沉寂已久的服務(wù)器領(lǐng)域近乎開(kāi)了場(chǎng)春晚,之所以這么引人關(guān)注,還是因?yàn)榻衲甏蠡鸬?a class="article-link" target="_blank" href="/tag/ChatGPT/">ChatGPT將人工智能再度推上風(fēng)口浪尖,英偉達(dá)GPU變成AI玩家們爭(zhēng)奪算力的搶手金磚,A100價(jià)格從去年12月一路上漲,5個(gè)月價(jià)格累計(jì)漲幅達(dá)到37.5%,同期其閹割版的A800價(jià)格累計(jì)漲幅達(dá)20.0%。
最大贏家英偉達(dá)前不久股價(jià)破萬(wàn)億美元,而在這場(chǎng)發(fā)布會(huì)的前幾天,AMD股價(jià)漲近10%,給AMD追趕英偉達(dá)多了幾分氣氛的烘托。
作為人工智能領(lǐng)域的王者,英偉達(dá)站在巔峰多時(shí)。這次AMD專為生成式AI 打造的GPU會(huì)對(duì)原有市場(chǎng)造成影響嗎?AI大火的時(shí)候,為什么很少見(jiàn)到AMD的身影?
01、1530億晶體管!MI300對(duì)標(biāo)H100
此次發(fā)布會(huì)上,AMD帶來(lái)了Instinct MI300系列的產(chǎn)品更多細(xì)節(jié)和更新、第四代的Epyc產(chǎn)品的更新,以及預(yù)告了之后將推出全新DPU芯片。不過(guò),最矚目的還是當(dāng)屬用于訓(xùn)練大模型的最先進(jìn)GPU Instinct MI300。
近期,AI熱度不減,英偉達(dá)憑借最新的超算以及以H100為首的高性能GPU,成功奪下AI王冠。排名第二的AMD的CEO蘇姿豐此前就曾放話表示,要從英偉達(dá)手中奪下AI王冠,此次所推出的MI300正是AMD搶奪AI市場(chǎng)的首輪攻勢(shì)。
MI300系列是AMD為AI和高性能計(jì)算(HPC)打造的一系列最新APU加速卡,此次發(fā)布了該系列兩款新芯片,MI300A是全球首款面向AI和HPC的APU,在設(shè)計(jì)上同時(shí)集成了CPU和GPU;MI300X是純GPU版本,采用了8 個(gè) GPU chiplet(基于CDNA 3架構(gòu))和另外 4 個(gè) IO 內(nèi)存chiplet的設(shè)計(jì)。簡(jiǎn)單來(lái)說(shuō),MI300A是“基礎(chǔ)款”,MI300X則是硬件性能更高的“大模型優(yōu)化款”。
MI300X是一款專門(mén)面向生成式AI推出的加速器,對(duì)標(biāo)英偉達(dá)H100。這款加速器全部采用GPU,集成的晶體管數(shù)量達(dá)到了驚人的1530億!并且,為了緩解AI大型語(yǔ)言模型?(LLM)?所面臨的內(nèi)存制約,AMD為這款芯片集成了192GB的HBM3,其存儲(chǔ)帶寬也高達(dá)5.2TB/s,可以處理的參數(shù)高達(dá)400億。
和H100相比,MI300X的高帶寬內(nèi)存(HBM)密度,最高可達(dá)英偉達(dá)H100的2.4倍,高帶寬內(nèi)存帶寬最高可達(dá)H100的1.6倍。也就是說(shuō),MI300X能運(yùn)行比H100更大的AI模型。
蘇姿豐現(xiàn)場(chǎng)展示了MI300X運(yùn)行包括GPT-3、PaLM2等大模型的優(yōu)勢(shì),并在單個(gè)MI300X?GPU上運(yùn)行擁有400億個(gè)參數(shù)的Falcon-40B大型語(yǔ)言模型,讓它寫(xiě)了一首關(guān)于舊金山的詩(shī)。這是全球首次在單個(gè)GPU上運(yùn)行這么大的模型。大模型所需要的GPU越少,開(kāi)發(fā)者的成本也越小。
另一款MI300A,號(hào)稱全球首款針對(duì)AI和高性能計(jì)算(HPC)的加速處理器(APU)加速器,在13個(gè)小芯片中遍布1460億個(gè)晶體管。它采用CDNA 3 GPU架構(gòu)和24個(gè)Zen 4 CPU內(nèi)核,配置128GB的HBM3內(nèi)存。相比前代MI250,MI300的性能提高八倍,效率提高五倍。外媒seminalysis表示,“這是迄今為止市場(chǎng)上最好的HPC芯片,并將保持一段時(shí)間?!?/p>
AMD還發(fā)布了AMD Instinct 平臺(tái),它擁有八個(gè)MI300X,采用行業(yè)標(biāo)準(zhǔn)OCP設(shè)計(jì),提供總計(jì)1.5TB的HBM3內(nèi)存。
蘇姿豐表示,MI300A已經(jīng)出樣,MI300X和八個(gè)GPU的Instinct 平臺(tái)將在今年第三季度出樣,第四季度正式推出。
02、大火的AI模型怎么不見(jiàn)AMD?
雖然AMD看起來(lái)并不像是慢半拍的樣子,這幾年動(dòng)作也頻頻。去年推出了專為數(shù)據(jù)中心設(shè)計(jì)的MI200系列GPU,還拿下了Meta數(shù)據(jù)中心的訂單。但今年ChatGPT大火后,被人熱議的始終只有英偉達(dá),連帶著與英偉達(dá)GPU相關(guān)的服務(wù)器都在漲價(jià),而英偉達(dá)也緊急向臺(tái)積電追加訂單,似乎它們也并未料到,這一波熱度是如此來(lái)勢(shì)洶洶。
所以AMD的存在感呢?
如果只從硬件方面看,AMD并沒(méi)有比英偉達(dá)差多少,各種紙面參數(shù)對(duì)比,AMD也沒(méi)有落下風(fēng)。但從人工智能應(yīng)用上看,或者說(shuō)現(xiàn)在流行的大模型,硬件就只是基礎(chǔ)。
我們常說(shuō)人工智能的三要素:算力、算法、數(shù)據(jù),芯片是算力的來(lái)源,算力的強(qiáng)與弱決定了你要耗費(fèi)多少時(shí)間,或者你要耗費(fèi)多少疊加算力的成本來(lái)完成訓(xùn)練模型,但很多時(shí)候軟件層面的優(yōu)化,會(huì)使效果事半功倍。
這就好比你玩游戲一樣,硬件再好,優(yōu)化很差,照樣卡成PPT。
所以為了方便開(kāi)發(fā)人員編程,英偉達(dá)和AMD都有自己的加速平臺(tái)(CUDA和ROCm),而以此打造的生態(tài),是它們之間差異的所在,也是這場(chǎng)大模型初期的博弈中,英偉達(dá)占據(jù)上風(fēng)的關(guān)鍵。
CUDA是英偉達(dá)的一種通用并行計(jì)算平臺(tái)和編程模型,它通過(guò)利用GPU的處理能力,可大幅提升計(jì)算性能。CUDA使英偉達(dá)的GPU能夠執(zhí)行使用C、C++、Fortran、OpenCL、DirectCompute和其他語(yǔ)言編寫(xiě)的程序。
在CUDA問(wèn)世之前,對(duì)GPU編程必須要編寫(xiě)大量的底層語(yǔ)言代碼,而CUDA可以讓普通程序員可以利用C語(yǔ)言、C++等為CUDA架構(gòu)編寫(xiě)程序在GPU平臺(tái)上進(jìn)行大規(guī)模并行計(jì)算,在全球GPGPU開(kāi)發(fā)市場(chǎng)占比已超過(guò)80%。GPGPU與CUDA組成的軟硬件底座,構(gòu)成了英偉達(dá)引領(lǐng)AI計(jì)算及數(shù)據(jù)中心領(lǐng)域的根基。
AMD的ROCm是基于開(kāi)源項(xiàng)目編寫(xiě),其生態(tài)采取HIP編程模型,但HIP與 CUDA的編程語(yǔ)法極為相似,開(kāi)發(fā)者可以模仿CUDA的編程方式為AMD的GPU產(chǎn)品編程,從而在源代碼層面上兼容CUDA。所以從本質(zhì)上來(lái)看,ROCm 生態(tài)只是借用了CUDA的技術(shù),無(wú)法真正替代CUDA產(chǎn)生壁壘。
與ROCm的開(kāi)源基礎(chǔ)不同,CUDA的誕生就只是為了英偉達(dá)自家GPU服務(wù),甚至它走在H100、A100等明星產(chǎn)品前,早在2007年英偉達(dá)就推出了CUDA,發(fā)展至今已經(jīng)相當(dāng)成熟,深受開(kāi)發(fā)者的喜愛(ài),目前主流的深度學(xué)習(xí)框架都使用CUDA,也就是說(shuō)現(xiàn)在的AI大模型幾乎都無(wú)法避開(kāi)CUDA,所以訓(xùn)練大模型自然而然首先想到的是英偉達(dá),而英偉達(dá)也基于此打了一套自家產(chǎn)品的組合拳,屬于軟件帶領(lǐng)硬件發(fā)家致富。
但AMD沒(méi)有機(jī)會(huì)了嗎?并不是。
基于CDNA架構(gòu)的AMD GPU是可以跑GPT大模型的,在這次發(fā)布會(huì)上,蘇姿豐也展示了MI300系列跑GPT等大模型的效果,紙面參數(shù)也要高于H100。更重要的是,AMD在會(huì)上宣布了與Hugging Face建立合作關(guān)系。
Hugging Face是人工智能獨(dú)角獸企業(yè),在機(jī)器學(xué)習(xí)領(lǐng)域的開(kāi)發(fā)者肯定不陌生。自從一家NLP公司轉(zhuǎn)型成為一家即用型機(jī)器學(xué)習(xí)模型平臺(tái)后,Hugging Face已經(jīng)托管了10萬(wàn)個(gè)預(yù)訓(xùn)練模型和1萬(wàn)個(gè)數(shù)據(jù)集,有超1萬(wàn)家企業(yè)正在使用該平臺(tái)構(gòu)建機(jī)器學(xué)習(xí)技術(shù)。
AMD與它的合作無(wú)疑是在補(bǔ)齊生態(tài)上的短板,這也是AMD最難跨越英偉達(dá)的一道坎,畢竟英偉達(dá)已經(jīng)苦心經(jīng)營(yíng)很久,AMD明顯算是后來(lái)者,苦于沒(méi)有應(yīng)用案例,未來(lái)或許會(huì)有專門(mén)針對(duì)ROCm的大模型出現(xiàn),只能說(shuō)AMD終于在機(jī)器學(xué)習(xí)領(lǐng)域亮了劍。
03、GPU緊缺會(huì)緩解嗎?會(huì)沖擊英偉達(dá)的市場(chǎng)?
從長(zhǎng)遠(yuǎn)來(lái)看,AMD會(huì)有一席之地,一方面整個(gè)通用GPU市場(chǎng),除了英偉達(dá)就是AMD了,而機(jī)器學(xué)習(xí)只是個(gè)開(kāi)始,未來(lái)人工智能和服務(wù)器及超算市場(chǎng)足夠龐大,AMD有能力去爭(zhēng)奪。另一方面,整個(gè)GPU及服務(wù)器市場(chǎng)已經(jīng)出現(xiàn)供不應(yīng)求的場(chǎng)面了,而下游應(yīng)用企業(yè)不會(huì)坐以待斃,站在風(fēng)口上,誰(shuí)速度快,誰(shuí)才有市場(chǎng)。
5月英偉達(dá)GPU的交期再次拉長(zhǎng),基本需要三個(gè)月或更長(zhǎng),部分新訂單“可能要到12月才能交付”,就連特供中國(guó)的A800(A100閹割版)都在市場(chǎng)上被炒到10萬(wàn)一塊,國(guó)內(nèi)字節(jié)跳動(dòng)等互聯(lián)網(wǎng)大廠紛紛找英偉達(dá)下大單,爭(zhēng)奪AI入場(chǎng)券。
在英偉達(dá)供應(yīng)緊缺的情況下,自然會(huì)有人想用其他方式來(lái)實(shí)現(xiàn),這不,微軟已經(jīng)找上AMD來(lái)合作開(kāi)發(fā)人工智能芯片,目的就是為了尋找另一條路徑,縱觀整個(gè)通用GPU市場(chǎng),大概只有AMD還有這樣的潛力。
但短期來(lái)看,AMD不太會(huì)緩解現(xiàn)在GPU供應(yīng)緊張的狀態(tài)。
首先,MI300系列正式推出要等到下半年,甚至到第四季度,各種基準(zhǔn)測(cè)試的結(jié)果都還沒(méi)披露,實(shí)際性能到底如何還不知道。
其次,AMD使用的也是臺(tái)積電的CoWoS先進(jìn)封裝。目前臺(tái)積電的產(chǎn)能已經(jīng)告急,英偉達(dá)和AMD合計(jì)占據(jù)了7-8成的產(chǎn)能,臺(tái)積電預(yù)計(jì)到2024年底擴(kuò)產(chǎn)到每月20000片產(chǎn)能,但光英偉達(dá)就要消耗預(yù)計(jì)一半的產(chǎn)能,AMD也在嘗試為明年預(yù)訂額外的產(chǎn)能,所以同樣都面臨著產(chǎn)能問(wèn)題。
最后,訓(xùn)練一個(gè)大模型要耗費(fèi)大量的時(shí)間和成本,業(yè)內(nèi)分析,MI300的封裝技術(shù)相當(dāng)復(fù)雜,成本不見(jiàn)得比英偉達(dá)有優(yōu)勢(shì),況且現(xiàn)在臺(tái)積電產(chǎn)能緊缺,AMD供貨能力有多少也并不清楚。要推出一個(gè)基于AMD架構(gòu)的模型,并以此打開(kāi)新的市場(chǎng),需要一定的時(shí)間,還得有人愿意為ROCm生態(tài)貢獻(xiàn)自己一份力。
發(fā)布會(huì)上,AMD并沒(méi)有透露誰(shuí)計(jì)劃使用這些芯片,發(fā)布會(huì)結(jié)束后,AMD的股價(jià)不漲反跌,也反映了市場(chǎng)對(duì)AMD的情緒。
04、總結(jié)
目前英偉達(dá)擁有超過(guò)80%的市場(chǎng)份額,占據(jù)人工智能芯片市場(chǎng)的主導(dǎo)地位。國(guó)外主流媒體與分析師似乎不太看好AMD這次與英偉達(dá)的較量,他們認(rèn)為,AMD不透露售價(jià),也不透露客戶,或許會(huì)讓華爾街失望,雖然對(duì)于微軟、亞馬遜等急著用芯片的企業(yè),AMD是不二的選擇,但這并不意味著能搶走英偉達(dá)多少市場(chǎng)份額,
蘇姿豐可能會(huì)回想起加入AMD后受到顧問(wèn)質(zhì)疑的時(shí)刻,就像此刻她面對(duì)整個(gè)華爾街質(zhì)疑的時(shí)候一樣。后來(lái)蘇姿豐帶領(lǐng)AMD走出低谷,從瀕死到涅槃,她創(chuàng)造了一個(gè)神話。
在近期的福布斯采訪中,蘇姿豐說(shuō)道:“如果你展望未來(lái)五年,你會(huì)看到AMD的每款產(chǎn)品都有AI的影子,它將成為最大的增長(zhǎng)驅(qū)動(dòng)因素。”
重生過(guò)后的AMD要翻越另一座大山,蘇姿豐能再一次創(chuàng)造神話嗎?