7777精品伊人久久久大香线蕉,久久久青草大香

隨著最新一代超級(jí)計(jì)算機(jī)日益與人工智能和云計(jì)算相結(jié)合，衡量這些機(jī)器的方式也在發(fā)生變化

從科學(xué)模擬、可視化、數(shù)據(jù)分析再到機(jī)器學(xué)習(xí)，各種現(xiàn)代計(jì)算的工作負(fù)載正在推動(dòng)超級(jí)計(jì)算中心、云服務(wù)提供商和企業(yè)重新思考他們的計(jì)算架構(gòu)。

僅靠處理器、網(wǎng)絡(luò)或軟件優(yōu)化已經(jīng)無(wú)法滿足研究人員、工程師和數(shù)據(jù)科學(xué)家的最新需求。

數(shù)據(jù)中心取而代之，成為新的計(jì)算單元，因此企業(yè)必須關(guān)注整個(gè)技術(shù)堆棧。

全球最強(qiáng)系統(tǒng)的最新排名顯示，在新一代超級(jí)計(jì)算機(jī)中，這種使用全棧方法的趨勢(shì)還在持續(xù)。

在本周SC21高性能計(jì)算大會(huì)上最新發(fā)布的TOP500榜單上，NVIDIA技術(shù)為355套超級(jí)計(jì)算機(jī)系統(tǒng)提供加速，占榜單的70%以上，而新增系統(tǒng)中90% 以上都采用了NVIDIA 的技術(shù)。對(duì)比6月份發(fā)布的TOP500榜單上342個(gè)系統(tǒng)（占榜單68%）使用NVIDIA技術(shù)，增長(zhǎng)趨勢(shì)明顯。

NVIDIA在全球最節(jié)能系統(tǒng)Green500榜單上也繼續(xù)保持領(lǐng)先優(yōu)勢(shì)，占據(jù)了榜單排名前25名系統(tǒng)中的23套，與6月份持平。平均來(lái)看，采用NVIDIA GPU的系統(tǒng)能耗效率比非GPU系統(tǒng)高3.5倍。

來(lái)自微軟的GPU加速Azure超級(jí)計(jì)算機(jī)在榜單上排名第十。這是基于云的系統(tǒng)首次躋身前10名，新一代云原生系統(tǒng)就此嶄露頭角。

人工智能正帶來(lái)一場(chǎng)科學(xué)計(jì)算的革命。近年來(lái)，研究高性能計(jì)算和機(jī)器學(xué)習(xí)的論文數(shù)量激增，從2018年的約600篇增長(zhǎng)到2020年的近5000篇。

包括HPL-AI和MLPerf HPC在內(nèi)的新基準(zhǔn)也強(qiáng)調(diào)了高性能計(jì)算和AI工作負(fù)載的持續(xù)融合。

作為一個(gè)融合了高性能計(jì)算和人工智能工作負(fù)載的新基準(zhǔn)，HPL-AI使用了深度學(xué)習(xí)和許多科學(xué)與商業(yè)工作的基礎(chǔ)——混合精度計(jì)算，同時(shí)還提供高性能計(jì)算基準(zhǔn)傳統(tǒng)的標(biāo)準(zhǔn)標(biāo)尺——雙精度計(jì)算的高度準(zhǔn)確性。

MLPerf HPC基準(zhǔn)適用于通過(guò)人工智能實(shí)現(xiàn)超級(jí)計(jì)算機(jī)模擬加速和增強(qiáng)的計(jì)算方式，主要被用來(lái)測(cè)試高性能計(jì)算中心天體物理學(xué)(Cosmoflow)、天氣(Deepcam)和分子動(dòng)力學(xué)(Opencatalyst)三大關(guān)鍵工作負(fù)載的性能表現(xiàn)。

NVIDIA通過(guò)GPU加速處理、智能網(wǎng)絡(luò)、GPU優(yōu)化應(yīng)用程序和支持AI和高性能計(jì)算融合的庫(kù)來(lái)解決整個(gè)堆棧的問(wèn)題。這一方法提升了工作負(fù)載的性能表現(xiàn)，并推動(dòng)了科學(xué)突破。

讓我們來(lái)具體看一看NVIDIA是如何助力超級(jí)計(jì)算機(jī)實(shí)現(xiàn)性能提升的。

加速計(jì)算
GPU的并行處理能力再加上超過(guò)2500個(gè)GPU優(yōu)化應(yīng)用程序，在多數(shù)情況下可以讓用戶把高性能計(jì)算任務(wù)的時(shí)間從幾周減少到幾個(gè)小時(shí)。

NVIDIA一直在優(yōu)化CUDA-X庫(kù)和GPU加速應(yīng)用程序，所以用戶如果發(fā)現(xiàn)自己的GPU架構(gòu)性能突然有了提升也很正常。

因此，應(yīng)用范圍最廣的科學(xué)應(yīng)用程序（我們稱之為“黃金套件”）的性能在過(guò)去6年里提高了16倍，而且還在不斷提升。

圖注：全棧創(chuàng)新帶來(lái)頂級(jí)高性能計(jì)算、人工智能和機(jī)器學(xué)習(xí)應(yīng)用程序的16倍性能提升。

為幫助用戶快速提升性能，NVIDIA通過(guò)NGC目錄中的容器提供最新版本的人工智能和高性能計(jì)算軟件。用戶只需在數(shù)據(jù)中心或云端的超級(jí)計(jì)算機(jī)上拖拽并運(yùn)行應(yīng)用程序即可。

高性能計(jì)算與人工智能融合
人工智能在高性能計(jì)算中的應(yīng)用能幫助研究人員加快模擬速度，同時(shí)保持傳統(tǒng)模擬方法的準(zhǔn)確性。

為此，越來(lái)越多的研究人員開(kāi)始利用人工智能來(lái)加快研究的速度，比如今年超算領(lǐng)域最有聲望的戈登·貝爾獎(jiǎng)（Gordon Bell prize）決賽的四組晉級(jí)團(tuán)隊(duì)。各大企業(yè)正在競(jìng)相建造E級(jí)人工智能計(jì)算機(jī)，以支持這種融合高性能計(jì)算和人工智能的新模式。

一些相對(duì)較新的基準(zhǔn)（如HPL-AI和MLPerf HPC）也印證了這一趨勢(shì)，強(qiáng)調(diào)了高性能計(jì)算和AI工作負(fù)載的持續(xù)融合。

為推動(dòng)這一趨勢(shì)，上周NVIDIA推出了一系列用于高性能計(jì)算的先進(jìn)的新的庫(kù)和軟件開(kāi)發(fā)工具套件。

圖是現(xiàn)代數(shù)據(jù)科學(xué)中的一個(gè)關(guān)鍵數(shù)據(jù)結(jié)構(gòu)。通過(guò)一個(gè)名為深度圖庫(kù)（DGL）的新型Python包，用戶現(xiàn)在可以把圖投影到深度神經(jīng)網(wǎng)絡(luò)框架中。

NVIDIA Modulus構(gòu)建并訓(xùn)練了一個(gè)內(nèi)嵌物理信息的機(jī)器學(xué)習(xí)模型，可以用來(lái)學(xué)習(xí)并遵循物理定律。

NVIDIA推出了三個(gè)新庫(kù):

ReOpt?– 可提高規(guī)模高達(dá)10萬(wàn)億美元的物流行業(yè)的運(yùn)營(yíng)效率。

cuQuantum?– 可加速量子計(jì)算研究。

cuNumeric?– 為Python社區(qū)的科學(xué)家、數(shù)據(jù)科學(xué)家、機(jī)器學(xué)習(xí)和人工智能研究人員加速NumPy。

NVIDIA的虛擬世界模擬和3D工作流協(xié)作平臺(tái)NVIDIA Omniverse負(fù)責(zé)把一切整合到一起。

Omniverse可用來(lái)模擬倉(cāng)庫(kù)、工廠、物理和生物系統(tǒng)、5G邊緣、機(jī)器人、自動(dòng)駕駛汽車甚至是虛擬形象的數(shù)字孿生。

NVIDIA上周宣布，將利用Omniverse構(gòu)建一臺(tái)名為Earth-2的超級(jí)計(jì)算機(jī)，通過(guò)創(chuàng)建一個(gè)數(shù)字孿生地球來(lái)預(yù)測(cè)氣候變化。

云原生超級(jí)計(jì)算

隨著超級(jí)計(jì)算機(jī)在數(shù)據(jù)分析、人工智能、模擬和可視化方面承擔(dān)越來(lái)越多的工作負(fù)載，CPU不得不在大型復(fù)雜的系統(tǒng)上支持更多的通信任務(wù)。

DPU（數(shù)據(jù)處理器）可以卸載多種操作，有效減輕這一壓力。

作為一個(gè)完全集成的片上數(shù)據(jù)中心平臺(tái)，NVIDIA BlueField DPU可以卸載和管理數(shù)據(jù)中心的基礎(chǔ)設(shè)施任務(wù)，釋放主機(jī)的處理器資源，從而實(shí)現(xiàn)更強(qiáng)的安全性和更高效的超級(jí)計(jì)算編排工作。

與NVIDIA Quantum InfiniBand平臺(tái)相結(jié)合，該架構(gòu)可提供最佳裸機(jī)性能，同時(shí)原生支持多節(jié)點(diǎn)租戶隔離。

NVIDIA的Quantum InfiniBand平臺(tái)提供可預(yù)測(cè)的裸機(jī)性能隔離。并且采用零信任安全防護(hù)，因而這些新系統(tǒng)也更加安全。

BlueField DPU將用戶應(yīng)用與基礎(chǔ)設(shè)施任務(wù)隔離開(kāi)來(lái)。最新的BlueField軟件平臺(tái)NVIDIA DOCA 1.2支持下一代分布式防火墻和更廣泛的線速數(shù)據(jù)加密。而NVIDIA Morpheus則會(huì)假設(shè)入侵者已經(jīng)進(jìn)入數(shù)據(jù)中心，將利用基于深度學(xué)習(xí)的數(shù)據(jù)科學(xué)來(lái)實(shí)時(shí)檢測(cè)入侵者的活動(dòng)。

新的網(wǎng)絡(luò)技術(shù)則會(huì)加速上述這些趨勢(shì)場(chǎng)景。

上周NVIDIA還發(fā)布了NVIDIA Quantum-2。這是一個(gè)400Gbps InfiniBand平臺(tái)，由Quantum-2交換機(jī)、ConnectX-7網(wǎng)卡、BlueField-3 DPU以及用于新網(wǎng)絡(luò)架構(gòu)的軟件組成。

NVIDIA Quantum-2提供了裸機(jī)高性能和安全多租戶優(yōu)勢(shì)，可以讓下一代超級(jí)計(jì)算機(jī)實(shí)現(xiàn)安全性、云原生以及更高的效率。

**基準(zhǔn)應(yīng)用：Amber、Chroma、GROM ACS、MILC、NAMD、PyTorch、Quantum Espresso;

Random Forest FP32、TensorFlow、VASP | GPU節(jié)點(diǎn)：雙插槽CPU和4顆P100、V100或A100 GPU。