突破傳統(tǒng)基礎(chǔ)設(shè)施
從云到邊緣,Arm Neoverse 正憑借出色的性能、效率、設(shè)計(jì)靈活性和總體擁有成本 (TCO) 優(yōu)勢(shì),革新傳統(tǒng)基礎(chǔ)設(shè)施芯片領(lǐng)域。
云和超大規(guī)模服務(wù)運(yùn)營(yíng)商正不斷增大計(jì)算密度。隨著 Microsoft Cobalt、阿里巴巴的倚天 710、AmpereOne等配置 128 核或以上的 CPU 設(shè)計(jì)進(jìn)入市場(chǎng),單個(gè)封裝可實(shí)現(xiàn)的性能更強(qiáng),且下一代的目標(biāo)還將遠(yuǎn)高于 128 核。
隨著 CPU 性能逐步提高,市場(chǎng)對(duì)人工智能 (AI)、網(wǎng)絡(luò)和加密加速器等專用計(jì)算的需求也隨之持續(xù)增長(zhǎng)。這顯然需要將這些加速器集成在一起,才能更有效地提高性能和效率,與此同時(shí),還需實(shí)現(xiàn)模塊化設(shè)計(jì),以便將加速器與不同的通用計(jì)算引擎進(jìn)行混合搭配。
基于 Neoverse N3 CPU 的 Neoverse CSS N3
圖 1:Neoverse CSS N3 概覽
Arm Neoverse 計(jì)算子系統(tǒng) (CSS) 支持在新的工藝節(jié)點(diǎn)上快速開發(fā)先進(jìn)的系統(tǒng)級(jí)芯片 (SoC)。通過在設(shè)計(jì)中使用預(yù)配置、預(yù)驗(yàn)證的 CSS,合作伙伴節(jié)省了 80 人/年的工程師時(shí)間,以及相應(yīng)的機(jī)會(huì)成本,使其能夠?qū)W⒂趯?shí)現(xiàn)助其系統(tǒng)增值的“秘密法寶”。
Neoverse CSS N3 構(gòu)建在 Neoverse CSS N2 經(jīng)過市場(chǎng)驗(yàn)證的優(yōu)良表現(xiàn)之上,能通過新的架構(gòu)功能提供更高的性能和效率,為數(shù)據(jù)中心市場(chǎng)帶來更優(yōu)越的單芯片性能和單 TCO 性能表現(xiàn)。此外,Neoverse CSS N3 還為邊緣和網(wǎng)絡(luò)應(yīng)用帶來了出色的效率。CSS N3 以 Neoverse S3 系統(tǒng) IP 為基礎(chǔ),Neoverse S3 系統(tǒng) IP 包括了一致性網(wǎng)狀網(wǎng)絡(luò) CMN S3、系統(tǒng)內(nèi)存管理單元 MMU S3 和片上網(wǎng)絡(luò) NOC S3。此外,CSS N3 還包含系統(tǒng)管理和本地控制處理器,以及 CPU 和系統(tǒng) IP 協(xié)同設(shè)計(jì)與共同開發(fā),以優(yōu)化 PPA 和系統(tǒng)級(jí)功能的支持。
Neoverse CSS N3 支持 32 顆 Neoverse N3 核心,可在低至 40W 的功率范圍內(nèi)實(shí)現(xiàn)優(yōu)異性能。該產(chǎn)品具備高度可配置性,適用于電信、數(shù)據(jù)處理單元 (DPU) 、網(wǎng)絡(luò)和云等多個(gè)領(lǐng)域,可以在 8 核至 32 核之間進(jìn)行擴(kuò)展配置。
除了性能和效率的大幅提升之外,Neoverse CSS N3 還支持基于芯粒的設(shè)計(jì)。它支持 UCIe 晶粒間 (die-to-die) 連接標(biāo)準(zhǔn),結(jié)合 Arm 新的 AMBA CHI C2C 協(xié)議,為構(gòu)建異構(gòu)加速計(jì)算奠定了基礎(chǔ)??梢灶A(yù)見的是,Arm Neoverse CSS N3 將在當(dāng)今專用計(jì)算領(lǐng)域蓬勃發(fā)展?;?CSS N3 的芯??赏ㄟ^ AMBA CHI C2C 連接到 I/O 一致性加速器,從而將加速器封裝在一起,進(jìn)一步提高性能和效率,這一方法可用來取代傳統(tǒng)的解決方案。在過往的解決方案中,其加速器是通過 PCIe 進(jìn)行板級(jí)連接,這會(huì)導(dǎo)致更高的延遲、軟件復(fù)雜性和功耗。
Neoverse N3 CPU 優(yōu)異的效率表現(xiàn)
以每瓦性能來衡量的性能效率是 CPU 評(píng)估的一大關(guān)鍵指標(biāo)。5G/6G 無線基礎(chǔ)設(shè)施要求現(xiàn)代計(jì)算解決方案表現(xiàn)出更高的性能,同時(shí)功耗預(yù)算須保持不變。新一代的 DPU 需要配備功能更強(qiáng)大的 CPU,以便在 PCIe 設(shè)備規(guī)范的限制內(nèi)運(yùn)行成熟的操作系統(tǒng)、虛擬機(jī)、容器及其他數(shù)據(jù)包處理功能。頭部云服務(wù)提供商正著手在機(jī)架的冷卻能力范圍內(nèi),部署核心數(shù)量更多、更密集的 CPU。“能效”幾乎是所有細(xì)分市場(chǎng)的主要設(shè)計(jì)決策要素。Neoverse N3 便是以能效作為其設(shè)計(jì)核心。
Neoverse N3 CPU 延續(xù)了 Neoverse N2 經(jīng)過市場(chǎng)驗(yàn)證的效率表現(xiàn)。經(jīng)過 Arm CPU 設(shè)計(jì)團(tuán)隊(duì)的不懈努力,他們強(qiáng)化了分支預(yù)測(cè)器、預(yù)取器的性能,并優(yōu)化了微架構(gòu),進(jìn)而實(shí)現(xiàn)了效率的提升。此外,他們還改進(jìn)了電源管理表現(xiàn),增加了精度更高的每核動(dòng)態(tài)電壓頻率調(diào)整 (DVFS) 功能,以實(shí)現(xiàn)更出色的性能效率。這些工作成果使得 N3 在效率表現(xiàn)上比上一代產(chǎn)品提高了 20% 以上。
Neoverse N3 可以滿足多樣的 SoC 設(shè)計(jì)要求,包括 16 核網(wǎng)絡(luò)設(shè)計(jì)、32 核電信 RAN 或云 DPU 設(shè)計(jì),以及 192 核超大規(guī)模和云 CPU 等等。Neoverse N3 還提供了多種電壓和頻率選擇,與 Neoverse N2 相比,其每核性能效率提高了 20% 至近 50%。
圖 2:Arm Neoverse N3 CPU
- 延續(xù)卓越效率表現(xiàn):在面積和功耗配置與 Neoverse N2 大致相同,且采用一樣的工藝節(jié)點(diǎn)下,Neoverse N3 在機(jī)器學(xué)習(xí) (ML) 和數(shù)據(jù)分析工作負(fù)載方面的性能約提升了三倍,在 SQL 數(shù)據(jù)庫(kù)、選定壓縮應(yīng)用程序,以及整數(shù)運(yùn)算性能等方面分別約提升了 1.3 倍、1.2 倍,以及 1.1 倍的性能。
- 靈活的緩存配置:Neoverse N3 提供多種緩存配置,可滿足不同計(jì)算場(chǎng)景的需求。許多橫向擴(kuò)展的云數(shù)據(jù)分析和數(shù)據(jù)庫(kù)應(yīng)用均能從更靠近核心的較大緩存中受益,因此我們?yōu)檫@一細(xì)分領(lǐng)域推出了 2MB L2 緩存選項(xiàng)。此外,1MB L2 緩存選項(xiàng)主要針對(duì) 5G/6G 無線基礎(chǔ)設(shè)施、企業(yè)網(wǎng)絡(luò)、DPU 和智能網(wǎng)卡 (SmartNIC) 以及超大規(guī)模服務(wù)器等各種任務(wù)中的通用計(jì)算,能夠?qū)崿F(xiàn)性能和面積的良好平衡;而較小的 32KB L1 和 128KB 則適合那些對(duì)緩存不敏感,但仍希望能以較小占用空間提供良好算力的工作負(fù)載。
總結(jié)
Neoverse N3 CPU 的推出實(shí)現(xiàn)了 Neoverse N 系列持續(xù)提供出色的每瓦性能的目標(biāo)。新的 CSS N3 結(jié)合了 Neoverse N3 優(yōu)異的性能和效率與 Neoverse S3 系統(tǒng) IP,成為一套定制性更強(qiáng)的計(jì)算子系統(tǒng)。與上一代的 CSS 相比,Neoverse CSS N3的每瓦性能可提高 20% 至近 50%。CSS N3 平臺(tái)適用于云到邊緣設(shè)計(jì),可幫助我們的合作伙伴將 Arm 強(qiáng)大的處理器與加密、網(wǎng)絡(luò)或 AI 加速器等等多種專用組件結(jié)合在一起,打造更具差異性的新產(chǎn)品。
我們的合作伙伴將有望在 2024 年底推出基于 Neoverse N3 和 CSS N3 的創(chuàng)新芯片設(shè)計(jì),讓我們共同翹首以待。