市場調(diào)研機(jī)構(gòu)Hyperion Research最新ISC24市場報告顯示,2023年全球HPC市場規(guī)模為372億美元,與2022年基本持平。未來5年,HPC服務(wù)器市場的年平均增長率預(yù)計為8.2%,存儲市場的年平均增長率預(yù)計為9.3%,GPU市場的年平均增長率預(yù)計為17%,云計算市場的年平均增長率預(yù)計為21%。整體HPC市場呈現(xiàn)穩(wěn)健增長態(tài)勢。
HPC訓(xùn)練/推理服務(wù)器的主流系統(tǒng)架構(gòu),主體算力由CPU芯片和AI芯片這兩顆芯片提供,但是一個完整的服務(wù)器,要能夠提供完整的算力,還需要非常多的互聯(lián)技術(shù),把芯片連接在一起。這里的互聯(lián)技術(shù)包含:AI芯片為了提升算力密度,會采用UCIe把兩個Die結(jié)合在一起,盡量突破算力瓶頸;內(nèi)存方面,CPU要經(jīng)過內(nèi)存接口,用DDR5做連接,AI芯片需要和HBM3/LPDDR5x做充分內(nèi)存,以提供足夠算力;針對大模型進(jìn)行運(yùn)算或進(jìn)行訓(xùn)練和推理,AI芯片與AI芯片之間,算力卡與算力卡之間,也需要高速接口互聯(lián),采用PCIe或Serdes,將所有算力芯片連接起來。
可見未來HPC的技術(shù)體系除了算力本身,互聯(lián)是非常核心的。
通過英偉達(dá)過往六七年的產(chǎn)品發(fā)展可以看到算力是如何提升的、瓶頸在哪,到2024年的B200,算力提升10-20倍,甚至到百倍的提升,從工藝發(fā)展來看,為了提升性能,先進(jìn)工藝采用是非常簡單直接的邏輯,從P100到B200的工藝演進(jìn)是從16nm一直演進(jìn)到4nm,但是我們看到工藝演進(jìn)逐漸接近極限,速度也在放緩。從AI芯片來看,到現(xiàn)在已經(jīng)接近光罩極限。這個時候Die to Die、RISC-V技術(shù)開始導(dǎo)入并發(fā)揮作用,直接的體現(xiàn)在英偉達(dá)的B200上,這可芯片首次采用互聯(lián)技術(shù),可以把算力的密度持續(xù)往上提升;
從內(nèi)存的趨勢角度,由于帶寬逐步進(jìn)化,從P100到B200,內(nèi)存提升超過10倍以上。從演進(jìn)來看,算力提升不僅僅體現(xiàn)在算力單元、算力密度上,還有內(nèi)存存取,現(xiàn)在的運(yùn)算模型越來越龐大,存取需要大量帶寬做參數(shù)存儲跟計算,內(nèi)存逐步演變成非常大的算力瓶頸;
同樣的,互聯(lián)也一樣,當(dāng)前單一計算芯片無法提供足夠的算力來支撐如此大的模型運(yùn)算,需要靠系統(tǒng)型算力,也就需要靠PCIe,將所有算力互聯(lián)在一起,在過去的七、八年中,總速度、總帶寬才得以實(shí)現(xiàn)10倍以上的提升。
接下來還能怎樣解決算力瓶頸?從上面提到的性能墻、內(nèi)存墻和互聯(lián)墻三個維度來考慮,高速接口IP成為一種可能的解題思路,這也是近年來很多IP企業(yè)紛紛加大對接口IP的投入的驅(qū)動力。
IPNest最新的數(shù)據(jù)統(tǒng)計顯示,2023年,半導(dǎo)體市場整體下滑,但接口IP領(lǐng)域增長了17%。預(yù)測數(shù)據(jù)顯示,2024年至2028年接口IP的增長更為強(qiáng)勁,與2020年代的20%增長相當(dāng)。接口IP類別占所有IP類別的份額已從2017年的18%上升至2023年的28%。這一趨勢將在未來10年內(nèi)進(jìn)一步擴(kuò)大,份額將增長到總量的38%。預(yù)計大部分增長來自三個類別:PCIe、內(nèi)存控制器(DDR)以及以太網(wǎng)與D2D,未來5年復(fù)合年增長率分別為19%、23%和22%。
我們也看到多家本土IP企業(yè)希望把握這一機(jī)會點(diǎn)大力發(fā)展高速接口IP,但不可否認(rèn),HPC高性能計算本身對產(chǎn)品性能、功能以及先進(jìn)工藝節(jié)點(diǎn)的要求都非常之高,以本土IP企業(yè)的人才和技術(shù)積累想在這一領(lǐng)域有所突破甚至是超越,難度可想而知。
芯耀輝董事長曾克強(qiáng)
“我們HPC類和AI類的客戶群成長很快?!苯?,在無錫舉辦的2024中國集成電路設(shè)計創(chuàng)新大會暨第四屆IC應(yīng)用展(ICDIA2024)期間,本土IP初創(chuàng)企業(yè)芯耀輝董事長曾克強(qiáng)介紹?!搬槍a(chǎn)最先進(jìn)的工藝節(jié)點(diǎn),我們的產(chǎn)品也可以做到明確的領(lǐng)先。同時也在導(dǎo)入國外的主流工藝,這一領(lǐng)域的友商很多,芯耀輝產(chǎn)品線相對會比較全,我們的產(chǎn)品包括DDR5可以做到和國際頭部企業(yè)同等速率,UCIe相關(guān)產(chǎn)品也可以做到24G速率,處于領(lǐng)先?!?/p>
從2020年6月創(chuàng)立,到2024年,芯耀輝已經(jīng)形成了較完整的高速接口IP產(chǎn)品線。“針對性能墻,芯耀輝提供完整的UCIe、XSR,承接D2D的互聯(lián),有標(biāo)準(zhǔn)的控制器;針對內(nèi)存墻,除了HBM、DDR、LPDDR,還提供Memory Compiler,Memory Compiler是內(nèi)存帶寬最高、性能最高的內(nèi)存存儲媒介,在運(yùn)算過程中,大算力芯片需要超高速帶寬內(nèi)存,來突破算力瓶頸;針對互聯(lián)墻,經(jīng)過大量驗(yàn)證,有非常多客戶采用芯耀輝的PCIe5/32G Serdes PHY IP,我們的解決方案,面向面積和帶寬,在控制部分進(jìn)行了大量優(yōu)化,面積節(jié)省40%左右,同時也提供下一代的完整PCIe6和112G Serdes解決方案?!痹藦?qiáng)提到。
作為IP提供商,最后往往需要為客戶提供更完整的產(chǎn)品組合和解決方案,對此,曾克強(qiáng)表示,“如果要做一個完善的一站式IP廠商,也需要控制器IP,這樣給客戶提供一整套的解決方案,這樣HBM的IP和數(shù)字控制器IP都是芯耀輝的,在互相協(xié)同兼容性、可靠性上都會做的更好,這也是行業(yè)規(guī)律。我們做的主要是基于和工藝相關(guān)的,以高速接口為核心,上下擴(kuò)展。包括數(shù)字各類接口IP以及數(shù)字控制器IP,還有工藝制造端的其他IP,都在我們的考慮當(dāng)中,但基本上核心是圍繞著工藝墻相關(guān)的產(chǎn)品來展開?!?/p>
“綜上所述,我們希望通過完整的產(chǎn)品組合,并提供完整的設(shè)計、全方位生態(tài)、Foundry等完整供應(yīng)鏈,可以給客戶帶來非常完整的解決方案,希望助力客戶在芯片設(shè)計和產(chǎn)品開發(fā)上持續(xù)迭代。”曾克強(qiáng)補(bǔ)充。