加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

全新MLCommons結(jié)果公布,英特爾在AI領(lǐng)域的優(yōu)勢(shì)盡顯

2023/06/28
2090
閱讀需 5 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

Habana Gaudi2和第四代英特爾至強(qiáng)可擴(kuò)展處理器AI訓(xùn)練提供領(lǐng)先的性能并大幅節(jié)約成本

今日,MLCommons公布其行業(yè)AI性能基準(zhǔn)測(cè)試MLPerf訓(xùn)練3.0的結(jié)果,其中,Habana? Gaudi? 2深度學(xué)習(xí)加速器與第四代英特爾?至強(qiáng)?可擴(kuò)展處理器展現(xiàn)出令人印象深刻的訓(xùn)練結(jié)果。

英特爾執(zhí)行副總裁兼數(shù)據(jù)中心人工智能事業(yè)部總經(jīng)理Sandra Rivera表示:“最新由MLCommons發(fā)布的MLPerf結(jié)果驗(yàn)證了使用英特爾至強(qiáng)可擴(kuò)展處理器和英特爾Gaudi深度學(xué)習(xí)加速器,可以在AI領(lǐng)域?yàn)榭蛻魩?lái)更高的性價(jià)比(TCO)。其中,至強(qiáng)的內(nèi)置加速器使其成為在通用處理器上運(yùn)行大量AI工作負(fù)載的理想解決方案,而Gaudi則為大語(yǔ)言模型和生成式AI提供了極具競(jìng)爭(zhēng)力的優(yōu)異性能。此外,英特爾的可擴(kuò)展系統(tǒng)配備了經(jīng)過(guò)優(yōu)化的、易于編程的開放軟件,可降低客戶和生態(tài)伙伴在數(shù)據(jù)中心部署從云到智能邊緣各種基于AI的解決方案的門檻。”

目前,業(yè)內(nèi)普遍認(rèn)為生成式AI和大語(yǔ)言模型(LLMs)僅適宜在GPU上運(yùn)行。然而,最新的數(shù)據(jù)顯示,基于英特爾產(chǎn)品組合的AI解決方案,能夠?yàn)樵诜忾]生態(tài)系統(tǒng)中尋求擺脫當(dāng)前效率與規(guī)模限制的客戶提供極具競(jìng)爭(zhēng)力的選擇。

最新的MLPerf訓(xùn)練3.0結(jié)果展現(xiàn)了英特爾產(chǎn)品在一系列深度學(xué)習(xí)模型上的優(yōu)異性能。在大語(yǔ)言模型GPT-3上,基于Gaudi2的軟件與系統(tǒng)在AI訓(xùn)練成熟度上得到了大規(guī)模驗(yàn)證。值得一提的是,Gaudi2是僅有的兩個(gè)向GPT-3大模型訓(xùn)練基準(zhǔn)提交性能結(jié)果的解決方案之一。

與此同時(shí),Gaudi2還為客戶提供了極具競(jìng)爭(zhēng)力的成本優(yōu)勢(shì),包括服務(wù)器和系統(tǒng)成本。其在GPT-3、計(jì)算機(jī)視覺和自然語(yǔ)言模型上經(jīng)由MLPerf驗(yàn)證的杰出性能,以及即將推出的軟件,使Gaudi2成為業(yè)界一個(gè)極具吸引力與性價(jià)比解決方案。

CPU方面,第四代至強(qiáng)可擴(kuò)展處理器采用英特爾AI引擎,其深度學(xué)習(xí)訓(xùn)練性能的結(jié)果表明,客戶可以使用基于至強(qiáng)的服務(wù)器,構(gòu)建一個(gè)通用AI系統(tǒng)以用于數(shù)據(jù)預(yù)處理、模型訓(xùn)練和部署,從而獲得兼具AI性能、效率、準(zhǔn)確性和可擴(kuò)展性的最優(yōu)組合。

關(guān)于Habana Gaudi2的測(cè)試結(jié)果: 訓(xùn)練生成式AI和大語(yǔ)言模型需要服務(wù)器集群來(lái)滿足大規(guī)模的計(jì)算要求。最新MLPerf結(jié)果切實(shí)驗(yàn)證了Habana Gaudi2在要求極為苛刻的模型——1750億參數(shù)的GPT-3上的出色性能以及高效的可擴(kuò)展性。

測(cè)試亮點(diǎn):

  • Gaudi2在GPT-3*上實(shí)現(xiàn)了令人印象深刻的訓(xùn)練時(shí)間: 在384個(gè)加速器上的訓(xùn)練時(shí)間為311分鐘。
  • 在GPT-3模型上,從256個(gè)加速器到384個(gè)加速器實(shí)現(xiàn)近線性95%的擴(kuò)展效果。
  • 在計(jì)算機(jī)視覺模型ResNet-50(8個(gè)加速器)和Unet3D(8個(gè)加速器)以及自然語(yǔ)言處理模型BERT(8個(gè)和64個(gè)加速器)上取得了優(yōu)異的訓(xùn)練結(jié)果。
  • 與去年11月提交的數(shù)據(jù)相比,BERT和ResNet模型的性能分別提高了10%和4%,證明Gaudi2軟件成熟度的提升。
  • Gaudi2支持“開箱即用”功能,客戶在本地或在云端使用Gaudi2時(shí),可以獲得與本次測(cè)試相當(dāng)?shù)男阅芙Y(jié)果。

Habana? Gaudi?2夾層卡

推薦器件

更多器件
器件型號(hào) 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊(cè) ECAD模型 風(fēng)險(xiǎn)等級(jí) 參考價(jià)格 更多信息
STM32F407ZGT6 1 STMicroelectronics High-performance foundation line, Arm Cortex-M4 core with DSP and FPU, 1 Mbyte of Flash memory, 168 MHz CPU, ART Accelerator, Ethernet, FSMC

ECAD模型

下載ECAD模型
$22.83 查看
SI5338B-B-GMR 1 Silicon Laboratories Inc Processor Specific Clock Generator, 350MHz, CMOS, QFN-24

ECAD模型

下載ECAD模型
$13.39 查看
STM32F405RGT6TR 1 STMicroelectronics High-performance foundation line, Arm Cortex-M4 core with DSP and FPU, 1 Mbyte of Flash memory, 168 MHz CPU, ART Accelerator

ECAD模型

下載ECAD模型
$13.5 查看
英特爾

英特爾

英特爾在云計(jì)算、數(shù)據(jù)中心、物聯(lián)網(wǎng)和電腦解決方案方面的創(chuàng)新,為我們所生活的智能互連的數(shù)字世界提供支持。

英特爾在云計(jì)算、數(shù)據(jù)中心、物聯(lián)網(wǎng)和電腦解決方案方面的創(chuàng)新,為我們所生活的智能互連的數(shù)字世界提供支持。收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜