?
當(dāng)下沒(méi)有比 AI 這個(gè)話題更火熱的了,憑借多年布局與卓越的 GPU 性能,英偉達(dá)成為 AI 芯片一哥,并以 AI 公司進(jìn)行自身定位。然而,眾多實(shí)力玩家對(duì)這個(gè)一哥位子垂涎欲滴。英偉達(dá)若想笑傲 AI 芯片江湖,先要把 FPGA、ASIC、TPU、類(lèi)腦芯片打敗才行。
在這幾大威脅中,F(xiàn)PGA 是最被熟知的,畢竟號(hào)稱(chēng)是“萬(wàn)能芯片”。透過(guò)以“All Programmable”定位的賽靈思進(jìn)行云計(jì)算、嵌入式視覺(jué)、工業(yè)物聯(lián)網(wǎng)以及 5G 無(wú)線全布局,就可以看到 FPGA 在多個(gè)市場(chǎng)的滲透,因其靈活性在多領(lǐng)域受寵。
近年來(lái),F(xiàn)PGA 越來(lái)越多地用于內(nèi)存數(shù)據(jù)庫(kù)加速和搜索,圖像處理中的轉(zhuǎn)碼與分析等方面。
賽靈思與英特爾的博弈只是剛剛開(kāi)始
近日,百度正式在全新的公有云加速服務(wù)器中,采用賽靈思 FPGA 產(chǎn)品線包括 Kintex FPGA、工具和軟件。百度 FPGA 云端服務(wù)器是百度云的一項(xiàng)新服務(wù),可為每位用戶(hù)提供一個(gè)獨(dú)享的 FPGA 加速平臺(tái),每個(gè) FPGA 都是一款專(zhuān)用的加速平臺(tái),而實(shí)例或用戶(hù)之間不會(huì)共享,包含深度學(xué)習(xí)加速、加解密等 FPGA 加速實(shí)例。
當(dāng)然百度并非首家,國(guó)內(nèi)首家被年初宣布推出 FPGA 云服務(wù)器的騰訊搶去了。不過(guò),騰訊的合作伙伴不止賽靈思一家,還有收購(gòu) Altera 的英特爾。
其實(shí)云平臺(tái)上支持最新的 FPGA 異構(gòu)計(jì)算架構(gòu)仍處于起步期。去年 10 月,亞馬遜 AWS 推出 FPGA 云服務(wù) EC2 F1;微軟在 Ignite 技術(shù)大會(huì)上演示了 FPGA 加速機(jī)器翻譯,并已經(jīng)使用 FPGA 加速 Bing 搜索和 Azure 云。
FPGA 結(jié)合云計(jì)算形成新的 FPGA-as-a-Service 或者 Accelerator-as-a-Service 平臺(tái),則可以整合多方資源解決上述問(wèn)題。平臺(tái)廠商與 FPGA 硬件廠商合作,在云端提供統(tǒng)一硬件平臺(tái)與中間價(jià),可大大降低加速器的開(kāi)發(fā)與部署成本。加速器開(kāi)發(fā)商的加速器上傳到云,可以形成服務(wù)銷(xiāo)售給加速器用戶(hù),消除加速技術(shù)與最終用戶(hù)的硬件壁壘。而加速器用戶(hù)則能夠在無(wú)需了解底層硬件的情況下,直接按需購(gòu)買(mǎi)和使用加速服務(wù),較傳統(tǒng)方案更快更省地完成數(shù)據(jù)處理。
?
業(yè)內(nèi)人士認(rèn)為,“FPGA+云”開(kāi)啟了云 2.0 時(shí)代,云計(jì)算未來(lái)競(jìng)爭(zhēng)焦點(diǎn)無(wú)疑是大數(shù)據(jù)和人工智能,這也將成為新時(shí)代云計(jì)算格局巨變的誘因。FPGA 云服務(wù)器可在芯片核心底層釋放人工智能潛力。
英特爾預(yù)測(cè),到 2020 年,超過(guò)三分之一的云計(jì)算節(jié)點(diǎn)將部署 FPGA 加速器。而微軟為了加快人工智能的發(fā)展時(shí)程而大力支持 FPGA。據(jù)業(yè)內(nèi)人士分析,這也是英特爾以 167 億美元收購(gòu) Altera 的原因之一。
可見(jiàn),賽靈思與英特爾在這一領(lǐng)域必將刀戈相向。
與非網(wǎng)小編也簡(jiǎn)單盤(pán)點(diǎn)了下熱門(mén) FPGA 云加速器上用的是哪顆芯。
云服務(wù)器上的 FPGA 芯
百度云,賽靈思 KU115 FPGA
百度自研 FPGA 加速卡使用賽靈思 20nm KU115 FPGA。FPGA 板卡帶有 4 通道 DDR4,每個(gè)通道 72bit,帶 ECC,容量 2GB,速率 2400Mhz。FPGA 通過(guò) PCIE 3.0x8 和 CPU 相連。板卡的結(jié)構(gòu)框圖如下所示:
基于上面的 FPGA 板卡,百度還提供的 FPGA 標(biāo)準(zhǔn)開(kāi)發(fā)環(huán)境,其系統(tǒng)結(jié)構(gòu)如下圖:
亞馬遜 EC2 F1,賽靈思 16nm Virtex UltraScale+ FPGA
AWS F1 使用的是 Xilinx 最新一代 UltraScale +架構(gòu)的高配 FPGA VU9P。FPGA 提供可編程的硬件加速器。 AWS 為 FPGA 開(kāi)發(fā)了新的鏡像格式,稱(chēng)為 AFI。用戶(hù)可使用 aws ec2 create-fpga-image 命令將編譯好的加速器注冊(cè)為 AWS AFI,然后可在任意 F1 實(shí)例上使用 AFI Management Tools 部署執(zhí)行。
AFI 是 F1 實(shí)例上對(duì) FPGA 編程的唯一方式,從安全和管理角度考慮,Amazon 目前沒(méi)有今后應(yīng)該也不會(huì)提供直接下載 Bitstream 到 FPGA 的接口。這樣,AMI 定義虛擬機(jī)系統(tǒng)鏡像,AFI 定義 FPGA 加速器鏡像,兩者合起來(lái)就能配置一臺(tái)完整的帶 FPGA 加速的服務(wù)器。加速器開(kāi)發(fā)商可以將加速器 AFI,或者 AMI+AFI 發(fā)布到 AWS Marketplace 進(jìn)行銷(xiāo)售。而加速器用戶(hù)只需使用傳統(tǒng)的 EC2 流程即可購(gòu)買(mǎi)開(kāi)啟 FPGA 加速實(shí)例。
?
騰訊云,賽靈思 Kintex UltraScale KU115 FPGA
騰訊云有賽靈思和英特爾兩種方案,推出的全新 FPGA 型 FX2 實(shí)例包含 3 個(gè)版本,都是搭載賽靈思 Kintex UltraScale KU115 FPGA??蓱?yīng)用于深度學(xué)習(xí)與實(shí)時(shí)圖像處理領(lǐng)域。
在深度學(xué)習(xí)方面,使用 FPGA 云服務(wù)器對(duì)深度學(xué)習(xí)模型中 CNN 算法的 Alexnet 模型進(jìn)行加速計(jì)算。采用 Alexnet 模型對(duì)圖像進(jìn)行分類(lèi)檢測(cè)對(duì)比測(cè)試,在性能上,F(xiàn)PGA 云服務(wù)器處理性能是 CPU 云服務(wù)器的 5 倍。
在圖像處理方面, 盡管 WEBP 圖片格式因其比 JPEG 圖片格式存儲(chǔ)空間小 30%,但其壓縮計(jì)算復(fù)雜度是 JPEG 壓縮的 10 倍以上。因此采用 CPU 進(jìn)行 WEBP 轉(zhuǎn)碼成本很高。為了增強(qiáng)圖片轉(zhuǎn)碼能力,使用 FPGA 云服務(wù)器進(jìn)行加速。對(duì) JPEG 格式圖片轉(zhuǎn)成 WEBP 格式圖片進(jìn)行測(cè)試對(duì)比,測(cè)試圖片大小為 853x640,F(xiàn)PGA 云服務(wù)器處理延時(shí)相比 CPU 服務(wù)器降低 20 倍,F(xiàn)PGA 云服務(wù)器處理性能是 CPU 服務(wù)器的 6 倍。
下一階段也會(huì)推出基于 Intel 的 FPGA 硬件平臺(tái)。
FPGA 備受青睞,但常人卻難以“消化”
FPGA 云服務(wù)器只是折射出了 FPGA 應(yīng)用領(lǐng)域的一角,可見(jiàn) FPGA 備受熱門(mén)應(yīng)用青睞。然而,自 Xilinx 在 1984 年創(chuàng)造出 FPGA 以來(lái),卻一直被廣大工程師認(rèn)為是難以“消化”的技術(shù),其主要障礙還在于編程方面。
為了解決這一痛點(diǎn),Xilinx 將 Vivado 產(chǎn)品作為重點(diǎn)推廣內(nèi)容,它可用 C 語(yǔ)言進(jìn)行設(shè)計(jì),軟件工程師就可輕松進(jìn)行硬設(shè)計(jì)。于此同時(shí),Altera 有一個(gè)已經(jīng)開(kāi)發(fā)的 OpenCL 環(huán)境。兩家公司都在試圖創(chuàng)建一個(gè)新環(huán)境,讓用戶(hù)可以使用更熟悉的編程(如 C 和 OpenCL),而不受 Verilog、VHDL 的限制。
FPGA 全球格局
FPGA 門(mén)檻之高在芯片行業(yè)里無(wú)出其右,因此這個(gè)領(lǐng)域被實(shí)力玩家壟斷。曾經(jīng)這還是四大巨頭賽靈思、Altera、Lattice、美高森美的的爭(zhēng)奪地。而如今在收購(gòu)、兼并、重組的大環(huán)境下,格局已大變。
? Altera:2015 年 12 月,全球第二大 FPGA 制造商 Altera 被芯片巨頭英特爾以 167 億美元完成收購(gòu),這也是英特爾歷史上最大的一起收購(gòu)。
? Lattice:2016 年 4 月紫光宣布在公開(kāi)市場(chǎng)收購(gòu) Lattice 6.07%股權(quán),致使 Lattice 的股票股價(jià)大漲 18%;2016 年 11 月 3 日, Lattice 被 Canyon Bridge 以 13 億美元收購(gòu)(還未正式確定)。
? Microsemi:2017 年 3 月 21 日,美高森美宣布關(guān)閉位于上海的制造工廠。預(yù)期,上海美高森美半導(dǎo)體有限公司正式關(guān)閉時(shí)間為 2017 年 10 月底。
本期《芯榜單》就到這里,下期見(jiàn)。
更多相關(guān)文章,歡迎訪問(wèn)與非網(wǎng)《芯榜單》系列!
?
與非網(wǎng)原創(chuàng)內(nèi)容,未經(jīng)許可,不得轉(zhuǎn)載!
?