加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權(quán)保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

Supermicro推出直接液冷優(yōu)化的NVIDIA Blackwell解決方案

11/22 08:46
596
閱讀需 10 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

Supermicro的SuperCluster配備了NVIDIA HGXTM B200 8-GPU、NVIDIA GB200、NVL4和NVL72系統(tǒng),提供升級的AI計算密度

Supermicro, Inc. (NASDAQ:SMCI)為AI、云端、存儲和5G/邊緣領(lǐng)域的全方位IT解決方案提供企業(yè),宣布推出高性能的SuperCluster。這一端對端AI數(shù)據(jù)中心解決方案采用NVIDIA Blackwell平臺,專為兆級參數(shù)規(guī)模的生成式AI時代所設(shè)計。全新SuperCluster將可大幅增加液冷機架中的NVIDIA HGX B200 8-GPU系統(tǒng)數(shù)量,與Supermicro目前領(lǐng)先業(yè)界的搭載NVIDIA HGX H100和H200的液冷型SuperCluster相比,GPU計算密度得到大幅提升。此外,Supermicro正在擴大其NVIDIA Hopper系統(tǒng)產(chǎn)品組合,以應(yīng)對加速型HPC應(yīng)用和主流企業(yè)級AI技術(shù)的快速普及。

Supermicro總裁兼首席執(zhí)行官梁見后(Charles Liang)表示:“Supermicro 擁有必要的專業(yè)技術(shù)、交付速度和產(chǎn)能,有能力部署包含100,000個GPU的全球最大液冷AI 數(shù)據(jù)中心項目,而通過Supermicro與NVIDIA的協(xié)作,該項目最近剛完成部署。這些Supermicro SuperCluster能通過高效直接液冷(DLC)技術(shù)降低電力需求。同時,我們現(xiàn)在推出了采用NVIDIA Blackwell平臺的解決方案。通過建構(gòu)組件(Building Block)技術(shù),能快速設(shè)計搭載NVIDIA HGX B200 8-GPU的服務(wù)器,并自由搭配液冷或氣冷散熱配置。我們的SuperCluster提供空前的密度、性能和效率,為未來更密集的AI計算解決方案奠定基礎(chǔ)。Supermicro的計算集群搭配直接液冷技術(shù),可幫助整個數(shù)據(jù)中心實現(xiàn)更高的性能和更低的功耗,并降低運營成本?!?/p>

經(jīng)驗證的大規(guī)模AI性能:Supermicro NVIDIA HGX B200系統(tǒng)

升級后的SuperCluster可擴充單元采用機架級設(shè)計,具有創(chuàng)新垂直冷卻液分配歧管(CDM),可使單一機架內(nèi)的計算節(jié)點數(shù)量增加。新開發(fā)的高效散熱冷板和先進的軟管設(shè)計可進一步改善液冷系統(tǒng)效率。適合大型部署的新型In-Row式冷卻液分配裝置(CDU)亦可被納入計算集群的散熱配置內(nèi)。傳統(tǒng)氣冷數(shù)據(jù)中心也能運用搭配新型氣冷系統(tǒng)機箱的全新NVIDIA HGX B200 8-GPU系統(tǒng)。

全新Supermicro NVIDIA HGX B200 8-GPU系統(tǒng)相較于前一代,提供了多項升級。這些新系統(tǒng)包含對散熱和電源方案的優(yōu)化,并支持雙500W Intel? Xeon? 6(配備DDR5 MRDIMM,傳輸速度達8800 MT/s)或AMD EPYCTM 9005系列處理器。而全新氣冷式10U機型Supermicro NVIDIA HGX B200系統(tǒng)則采用經(jīng)重新設(shè)計的機箱,具有更佳的散熱空間以支持8 個1000W TDP Blackwell GPU。這些系統(tǒng)在GPU搭配NIP的架構(gòu)上采用1:1比例設(shè)計,并支持NVIDIA BlueField?-3 SuperNIC或NVIDIA ConnectX?-7 NIC,可在高性能計算結(jié)構(gòu)內(nèi)進行擴充。此外,每個系統(tǒng)所配備的兩個NVIDIA BlueField-3數(shù)據(jù)處理器(DPU),能使附加型高性能AI存儲裝置之間的數(shù)據(jù)傳輸處理效率得到提升。

采用NVIDIA GB200 Grace Blackwell超級芯片的Supermicro解決方案

Supermicro亦提供搭配所有NVIDIA GB200 Grace Blackwell超級芯片的解決方案,包括最新發(fā)布的NVIDIA GB200 NVL4超級芯片和NVIDIA GB200 NVL72單機架百萬兆級計算機。

Supermicro的NVIDIA MGX系列設(shè)計將支持NVIDIA GB200 Grace Blackwell NVL4 超級芯片。這款超級芯片啟動了融合式高性能計算與AI的未來,并通過NVLink-C2C技術(shù),以及四個由NVIDIA NVLink? 連接的Blackwell GPU與兩個NVIDIA Grace? CPU,提供了革命性的性能。這些超級芯片與Supermicro的液冷型NVIDIA MGX模塊化系統(tǒng)兼容,且相較于上一代產(chǎn)品,能為科學(xué)計算、圖神經(jīng)網(wǎng)絡(luò)(GNN)訓(xùn)練和推理應(yīng)用提供至高兩倍的性能。

搭配Supermicro端對端液冷解決方案的NVIDIA GB200 NVL72 SuperCluster能在具有SuperCloud Composer(SCC)軟件的單個機架中組成一個百萬兆級超級計算機,為液冷數(shù)據(jù)中心提供全面的監(jiān)控與管理能力。72個NVIDIA Blackwell GPU和36個NVIDIA Grace CPU皆通過第五代NVIDIA NVLink和NVLink Switch連接,能有效地作為單個強大GPU運行,并擁有高度容量的HBM3e內(nèi)存集區(qū),以實現(xiàn)低延遲的130TB/s總GPU通訊帶寬。

搭載NVIDIA H200 NVL的加速計算系統(tǒng)

Supermicro的 5U PCIe加速計算系統(tǒng)現(xiàn)可搭載NVIDIA H200 NVL,適用于需要彈性配置的低功耗、氣冷型企業(yè)級機架設(shè)計,并能為許多AI和高性能計算工作負(fù)載進行加速(無論機體尺寸大?。?。NVIDIA H200 NVL能通過NVIDIA NVLink,將最多四個GPU相連,并搭配1.5倍內(nèi)存容量,以及通過HBM3e得到提高的1.2倍帶寬,可實現(xiàn)數(shù)小時內(nèi)的LLM快速微調(diào),同時也提供比前一代快1.7倍的LLM 推理性能速度。NVIDIA H200 NVL亦包含NVIDIA AI Enterprise的五年服務(wù),而NVIDIA AI Enterprise是一個用于開發(fā)與部署生產(chǎn)型AI的云端原生軟件平臺。

Supermicro 的X14和H14 5U PCIe加速計算系統(tǒng)通過NVLink技術(shù)支持多達兩個4路NVIDIA H200 NVL系統(tǒng),在單個系統(tǒng)內(nèi)可搭載8個GPU,提供最高900GB/s的GPU互連傳輸速度,而每4-GPU NVLink域的組合集區(qū)具有 564GB 的 HBM3e 內(nèi)存。全新PCIe 加速計算系統(tǒng)支持最高10個PCIe GPU,現(xiàn)在也可搭載最新Intel Xeon 6或AMD EPYC 9005系列處理器,能為高性能計算和AI應(yīng)用提供靈活且多功能的選項。

Supermicro亮相2024年超級計算大會

Supermicro在超級計算大會上展示了完整的AI和高性能計算基礎(chǔ)架構(gòu)解決方案組合,包括用于AI SuperCluster的液冷GPU服務(wù)器。通過展位的演講議程,您可以了解客戶、Supermicro專家及我們的技術(shù)合作伙伴所介紹的最新突破性計算技術(shù)。

歡迎蒞臨Supermicro在2024年超級計算大會的展位,位于 B廳2531號。

相關(guān)推薦

電子產(chǎn)業(yè)圖譜