當(dāng)英特爾在 2015 年以 167 億美元的價格收購 Altera 時,公司官員預(yù)測,到 2020 年,多達(dá)三分之一的服務(wù)器將配備 FPGA。盡管這種情況不太可能發(fā)生,但它不會削減英特爾在數(shù)據(jù)中心和其他地方對 FPGA 的野心。
為什么英特爾的野心不改?在過去四年中,英特爾憑借其 FPGA 產(chǎn)品部署了一些值得注意的成功案例,最引人注目的可能是微軟接納了 Project Catapult 技術(shù)。這項技術(shù)為在整個 Azure 云中部署英特爾 FPGA 奠定了基礎(chǔ),這些設(shè)備用于加速從 Bing 搜索到網(wǎng)絡(luò)服務(wù)的所有內(nèi)容。
最近,英特爾透露日本互聯(lián)網(wǎng)服務(wù)提供商樂天(Rakuten)正在使用英特爾 FPGA 通過其移動網(wǎng)絡(luò)加速語音和視頻數(shù)據(jù)。在邊緣計算領(lǐng)域,NEC 正在利用 Arria 10 FPGA 為 NeoFace 提供算力支持,NeoFace 是一個人臉識別引擎,有著非常廣泛的應(yīng)用場景。
值得注意的是,所有這些用例都是英特爾 FGPA 與 Xeon 處理器協(xié)同工作的,這是該芯片制造商自收購 Altera 以來常用的一個組合。英特爾最初的 Xeon-FGPA 混合產(chǎn)品非常有吸引力,但沒有出現(xiàn)任何商業(yè)化的跡象。
直到本周。
?
?
被稱為 AgileX 的新產(chǎn)品系列似乎就是 Xeon-FPGA 的混合體。實際上,Xeon 處理器看上去像是平臺的附件,它們共享緩存,而不是作為集成組件存在。我們馬上就會談到這一點,在我們分解平臺的各個部分之前,我們先來了解英特爾已應(yīng)用到到架構(gòu)中的各種技術(shù)。
從本質(zhì)上講,AgileX 是一個異構(gòu)的邏輯存儲器和接口包,可以將 FPGA 內(nèi)核(包括可配置的 DSP 和可選的 Arm SoC)與 Xeon 處理器,定制芯片(實際上是小芯片)和 I / O 設(shè)備連接起來。FPGA 和其他組件之間的連接是通過英特爾的嵌入式多芯片互連橋接器(EMIB)實現(xiàn)的,該技術(shù)旨在將單個封裝內(nèi)的不同芯片連接在一起。
毫無疑問,F(xiàn)PGA 部件將使用英特爾的 10nm 工藝節(jié)點制造,與目前的 Stratix 10 FPGA 相比,性能提升 40%,而功耗則降低 40%。目前尚不清楚這種更好的性能和效率有多少歸功于強(qiáng)化的 DSP,但看起來這個組件已經(jīng)進(jìn)行了升級。
根據(jù)英特爾的說法,AgileX DSP 提供高達(dá) 40 個 16 比特的峰值萬億次浮點運算性能,并支持 FP32,bfloat16,F(xiàn)P16 和 INT8 數(shù)字格式。它還可以配置為支持較低精度的整數(shù) - INT7 到 INT2 之間的任何值。英特爾表示,這是第一款支持硬化 bfloat16 和 FP16 的 FPGA。鑒于這些格式,我們可以看出英特爾的目標(biāo)非常明確,就是要將 FPGA 應(yīng)用于推理經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)。
正如我們所提到的,AgileX 設(shè)備可以連接到 Xeon 處理器,通過緩存一致的 UltraPath Interconnect(UPI)鏈接實現(xiàn)連接,允許 FGPA 和 Xeon 存儲器共享相同的地址空間。這里解釋一下 UPI,UPI 是 2017 年夏天在 Skylake Xeon SP 處理器中引入的 QPI 的更高效和更快(10.4 GT / sec)的替代品,它在 Agilex 中的存在體現(xiàn)了英特爾希望 FPGA 可以充當(dāng) CPU 的真正對等體,而不僅僅是掛在 PCI-Express 總線上的協(xié)處理器。
對于更專業(yè)的處理,AgileX 設(shè)備還可以連接來自英特爾和第三方提供商的定制芯片。英特爾提出的一項關(guān)鍵技術(shù)是 eASIC,這項技術(shù)就是英特爾收購的 eASIC 這家公司的技術(shù)。
它可以將可配置的邏輯塊轉(zhuǎn)換為 FPGA 和 ASIC 之間的中間件。根據(jù)英特爾的說法,eASIC“提供更接近標(biāo)準(zhǔn)單元 ASIC 的性能和功效,但設(shè)計時間更短,而且與 ASIC 相關(guān)的非經(jīng)常性工程成本的一小部分。”聲稱它可以提供在短短五周內(nèi)測試原型。鑒于此,我們感覺 eASIC 技術(shù)將在不久的將來在其他英特爾產(chǎn)品中亮相。
異構(gòu)性也擴(kuò)展到 AgileX 內(nèi)存和 I / O 上,該平臺支持 DDR4,DDR5 和高帶寬內(nèi)存(HBM),以及英特爾自己的 Optane DC 持續(xù)性內(nèi)存,而設(shè)備連接則由 PCI-Express 4.0 或 5.0 提供。還提供 112G SerDes 收發(fā)器接口,其中四個通道足以提供 400 Gb /s 的網(wǎng)絡(luò)鏈路。
AgileX 產(chǎn)品系列分為 F 系列,I 系列和 M 系列,下圖顯示了每個系列中可用的各種界面和選項,按照字母排序,功能依次增加。
細(xì)分還反映了 AgileX 所針對的各種環(huán)境:從超大規(guī)模云和企業(yè)數(shù)據(jù)中心到邊緣和嵌入式空間。請注意,應(yīng)用程序集與今天 GPU 正在應(yīng)用的許多領(lǐng)域重疊,我們也非常好奇,英特爾將如何定位即將在 2020 年推出的即將推出的 X e? 分立 GPU,也許 X e 小芯片選項正在開發(fā)中。
我們免不了將 AgileX 與去年推出的 Xilinx 自適應(yīng)計算加速平臺(ACAP)進(jìn)行比較。與 AgileX 一樣,ACAP 作為異構(gòu)軟件包實現(xiàn),以 FPGA 為基礎(chǔ),旨在為數(shù)據(jù)中心和邊緣環(huán)境中的各種工作負(fù)載提供以數(shù)據(jù)為中心的平臺。但是 AgileX 引入了許多本土的英特爾技術(shù),Xilinx 難以重現(xiàn)這些技術(shù)。這將成為未來幾年有趣的競爭,因為兩家公司都在改進(jìn)產(chǎn)品并在各自的技術(shù)和專業(yè)知識方面發(fā)揮各自的優(yōu)勢。
與此同時,英特爾必須將客戶和第三方 IP 提供商吸引到 AgileX 中。這是從 4 月份開始的,當(dāng)時公司計劃讓選定的用戶盡早訪問 AgileX 硬件和開發(fā)工具,英特爾計劃在今年第三季度公布這項技術(shù)。
與非網(wǎng)編譯內(nèi)容,未經(jīng)許可,不得轉(zhuǎn)載!