加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

日本得意的CPU+GPU異構(gòu)式超算,在中國早已不新鮮

2017/04/06
22
閱讀需 34 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

 

日前,有媒體發(fā)布了《除了圓珠筆頭,中國還有哪些核心技術(shù)沒掌握?答案令人震驚……》一文,并在網(wǎng)絡(luò)上廣泛傳播。文章中介紹了很多中國在諸多科技領(lǐng)域的短板,說明了在精密儀器、數(shù)控機(jī)床等領(lǐng)域中國依然和國際頂尖水平有較大差距。但文章存在一些明顯的謬誤,比如介紹了幾項(xiàng)有關(guān)超算的內(nèi)容,但這幾項(xiàng)技術(shù)卻并非中國還未掌握的核心技術(shù)。


日本在 CPU+GPU 異構(gòu)式超算方面技術(shù)成果非常有限
《除了圓珠筆頭,中國還有哪些核心技術(shù)沒掌握?答案令人震驚……》一文中稱:

“cpu/gpu 異構(gòu)式超算系統(tǒng)的提倡者兼此平臺(tái)程序軟件的先驅(qū)開發(fā)者,超級(jí)計(jì)算機(jī)界最高峰學(xué)術(shù)賞 sidney fernbach award 的新科得主——東京工業(yè)大學(xué)全球科學(xué)信息計(jì)算中心 prof.satoshi matsuoka;隨著后續(xù)軟體資源的快速配套和并行集群計(jì)算技術(shù)的加速發(fā)展,cpu/gpu 異構(gòu)式超算已經(jīng)成為整個(gè) hpc 界的事實(shí)標(biāo)準(zhǔn)體系,從最早的 tsubame1.2 到連續(xù) green500 測試頭名的 tsubame-kfc,目前全球幾乎所有高性能超算系統(tǒng)都是此架構(gòu)的支持者,matsuoka 博士也因此獲得了象征超級(jí)計(jì)算機(jī)領(lǐng)域個(gè)人最高榮譽(yù)的 sidney fernbach award”

拋開文章中非常拗口的表達(dá)方式不談,該文章中的內(nèi)容很容易誤導(dǎo)讀者,以為日本在 cpu/gpu 異構(gòu)式超算方面有很高的成就。那么,實(shí)際情況又是怎么樣呢?

CPU+GPU 異構(gòu)式超算系統(tǒng)僅僅是異構(gòu)式超算系統(tǒng)的一個(gè)選項(xiàng),而日本 matsuoka 博士是 CPU+GPU 異構(gòu)式超算系統(tǒng)的提倡者,而之后的完善和實(shí)現(xiàn)是全球眾多工程師、公司合力的結(jié)果,比如中國國防科大、美國英偉達(dá)公司等都參與其中。

就 CPU+GPU 異構(gòu)式超算的技術(shù)成果來說,中國有天河 1A,美國有泰坦。相比之下,日本在 CPU+GPU 異構(gòu)式超算方面卻沒有性能與泰坦相似的 CPU+GPU 異構(gòu)式超算系統(tǒng),根本沒能建成哪怕一臺(tái)性能達(dá)到神威太湖之光十分之一的 cpu/gpu 異構(gòu)式超算。即便是日本最新建的超算 Oakforest-PACS,也使用的是 Intel 的眾核加速器,而非美國英偉達(dá)公司的 GPGPU。


日本新超算 Oakforest-PACS

 


CPU+GPU 異構(gòu)式超算并非高不可攀


異構(gòu)計(jì)算要使用不同類型的處理器來處理不同類型的計(jì)算任務(wù)。常見的計(jì)算單元包括 CPU、GPGPU、GPDSP、ASIC、FPGA 和其它類型的眾核處理器等。采用異構(gòu)計(jì)算架構(gòu)的超算會(huì)使用至少 2 種類型的處理器,其中異構(gòu)計(jì)算架構(gòu)中通用 CPU 負(fù)責(zé)邏輯復(fù)雜的調(diào)度和串行任務(wù),加速器負(fù)責(zé)并行度高的任務(wù),實(shí)現(xiàn)計(jì)算加速。

具體來說,采用異構(gòu)計(jì)算架構(gòu)的超算在運(yùn)算中既使用處理器,又使用 GPU 或眾核芯片等加速器。中國天河 2 號(hào)、美國泰坦都采用異構(gòu)計(jì)算架構(gòu)。

而根據(jù)使用的加速器不同,異構(gòu)超算也有多種類型。

比如美國超算泰坦、中國的天河 1A,就是 CPU+GPGPU。

中國超算天河 2 號(hào)就是 CPU+眾核處理器。

中國天河 2A 超算則是 CPU+GPDSP。由于美國對(duì)中國四家超算中心禁售 Intel 至強(qiáng) PHI 計(jì)算卡,升級(jí)之后的天河 2A 采用自主研發(fā)的矩陣 2000 來替代 Intel 的計(jì)算卡,在更換加速器之后,變成了 CPU+GPDSP,這是全球首創(chuàng)。

此外,也可以直接使用經(jīng)過有著特殊設(shè)計(jì)的眾核芯片,比如神威太湖之光,這也是全球首創(chuàng),國外間諜對(duì)中國這款眾核芯片非常感興趣。原因就在于這款眾核芯片憑借設(shè)計(jì)理念的先進(jìn)性,以落后美國 Intel 公司 2 代的制造工藝,實(shí)現(xiàn)了與美國 Intel 公司最先進(jìn)計(jì)算卡相似的性能。

從中可以看出,CPU+GPU 異構(gòu)體系只是異構(gòu)超算體系的一個(gè)選項(xiàng),而非什么高不可攀的黑科技。而且無論是中國天河 2A 的 CPU+GPDSP,還是神威太湖之光的眾核異構(gòu)體系目前都是全球唯一,而且性能無與倫比。

 


文中“目前全球幾乎所有高性能超算系統(tǒng)都是此架構(gòu)的支持者”不符合客觀事實(shí)
文章中稱:“cpu/gpu 異構(gòu)式超算已經(jīng)成為整個(gè) hpc 界的事實(shí)標(biāo)準(zhǔn)體系”,“目前全球幾乎所有高性能超算系統(tǒng)都是此架構(gòu)的支持者”。但這與客觀事實(shí)不相符。


舉例來說,如上圖所示:2016 年 TOP500 前 10 的超算依次為:

神威太湖之光,中國,性能 93P;

天河 2 號(hào),中國,性能 33P;

泰坦,美國,性能 17P;

紅杉,美國,性能 17P;

科里,美國,性能 14P;

Oakforest-PACS,日本,13P;

京,日本,性能 10P;

代恩特峰,瑞士,性能 9P;

米拉,美國,性能 8P;

三一,美國,性能 8P。

在這當(dāng)中,紅杉、米拉、三一、京都是屬于同構(gòu)體系超算,壓根就不是異構(gòu)體系超算,更遑論 cpu/gpu 異構(gòu)式超算。

而天河 2 號(hào)、科里、Oakforest-PACS 采用的是 CPU+眾核加速器,雖然屬于異構(gòu)超算體系,但并非 cpu+gpu 異構(gòu)式超算。

神威太湖之光在技術(shù)上獨(dú)樹一幟,將管理核心與加速器合二為一,屬于眾核異構(gòu)超算。

在全球性能最強(qiáng)的 10 臺(tái)超算中,只有泰坦和代恩特峰使用了英偉達(dá)的 GPGPU,屬于 cpu/gpu 異構(gòu)式超算。

從中可以看出,“cpu/gpu 異構(gòu)式超算已經(jīng)成為整個(gè) hpc 界的事實(shí)標(biāo)準(zhǔn)體系”,“目前全球幾乎所有高性能超算系統(tǒng)都是此架構(gòu)的支持者”這種說法是站不住腳的。

過度鼓吹被淘汰技術(shù)并不可取
文章中稱:“NEC 喧布已開發(fā)完成最新型 SX 系列矢量超級(jí)計(jì)算機(jī)——SX-ACE 這臺(tái)采用 sun 架構(gòu)的矢量超算雖然其總體運(yùn)算能力(130TFLOPS)排不進(jìn)世界前 5,但卻具備世界第一的單核性能(64GFLOPS)和世界第一的單核內(nèi)存帶寬(64GB/s),并利用獨(dú)到的工業(yè)設(shè)計(jì)實(shí)現(xiàn)緊湊化與低耗能”。


首先要明確的是,日本比較推崇向量機(jī),SX-ACE 其實(shí)是向量機(jī),中國在幾十年前也曾經(jīng)做過,比如已經(jīng)有不少年月的國內(nèi)首臺(tái)銀河億次機(jī)就是向量機(jī)。因而向量機(jī)對(duì)于中國來說并非什么沒有掌握的技術(shù)。

現(xiàn)在中國不做向量機(jī),并非沒有掌握該技術(shù)而做不了,而是完全是不屑于做。因?yàn)檫@種向量機(jī)完全早過時(shí)了,完全是被淘汰的設(shè)計(jì),性能低就不說了,還有成本高,應(yīng)用范圍窄的缺點(diǎn),更要命的是可擴(kuò)展性也不好。

對(duì)于日本的 SX-ACE,國內(nèi)從事高性能計(jì)算機(jī)的資深工程師表示:這機(jī)器現(xiàn)在大概已不存在了吧 ..... 我說大概不存在,主要是目前很少有人再去推崇向量機(jī);第二就是這臺(tái)機(jī)器的性能參數(shù)并不突出,不值得耗費(fèi)時(shí)間精力去關(guān)注。

最后要補(bǔ)充的是 SX-ACE 很多技術(shù)其實(shí)源自美國 SUN 公司,比如其 SPARC 處理器,就是 SUN 公司的遺產(chǎn)。

 


中國在超算技術(shù)上領(lǐng)先日本
在 2011 年,日本超算京曾經(jīng)位列 TOP500 第一。但由于日本經(jīng)濟(jì)在廣場協(xié)議之后一直保持在低迷的狀態(tài),加上超算本來就屬于偏向國家工程的項(xiàng)目,相對(duì)較少的建造量和昂貴的價(jià)格都很難讓私人公司通過超算獲取高額利潤,在研發(fā)成本過于高昂的情況下,使得日本 NEC、日立等大公司先后退出超算研發(fā)領(lǐng)域,唯有富士通還在苦苦支撐。

而在超算研發(fā)經(jīng)費(fèi)的撥付上,日本政府相當(dāng)吝嗇。而且還曾發(fā)生過這樣一件事——數(shù)位日本科學(xué)家聯(lián)名向政府申請(qǐng)超算研發(fā)經(jīng)費(fèi),結(jié)果遭到日本政客反問:“當(dāng)老二有什么不好?”

也正是因此,由于長時(shí)間缺乏經(jīng)費(fèi),導(dǎo)致日本在超算技術(shù)上缺乏大型工程的磨礪。對(duì)于此,日本官方也是心知肚明。在 2016 年,日本文部科學(xué)省發(fā)表了后續(xù)基本設(shè)計(jì)方針:“在發(fā)展方針中,日本文部科學(xué)省不再追求世界第一的計(jì)算速度,而是將目標(biāo)由加快計(jì)算速度轉(zhuǎn)向了加強(qiáng)節(jié)能及便捷功能”。但從曾經(jīng)追求計(jì)算性能最強(qiáng)超算,到如今的追求最節(jié)能超算,想必日本從事超算建設(shè)的工程師們心中除了無奈只有苦笑吧。

在美國鹽湖城 SC16 全球超算大會(huì)期間召開的第 14 屆 HPC Connection Workshop 中外超算高峰論壇(HPCC)上,日本理化所 Mitsuhisa Sato 透露了日本發(fā)展 E 級(jí)超算的“旗艦 2020 計(jì)劃”,宣布將在 2017 年 4 月投入運(yùn)營 Post K 超級(jí)計(jì)算機(jī),其系統(tǒng)峰值性能約為 25P, 1000P 超算的升級(jí)計(jì)劃被排到了 2020 年。

不過,技術(shù)發(fā)展有其規(guī)律,是一步一個(gè)腳印迭代演進(jìn)的,大躍進(jìn)式一口吃成一個(gè)胖子的做法并不可取。而且日本的超算建設(shè)十有八九無法按時(shí)完成,舉例來說,如今已將近 2017 年 4 月份了,日本理化所計(jì)劃中投入運(yùn)營的 25P 超算尚無音訊。何況日本最新的 Oakforest-PACS 也只有 13P,從 13P 迅速跨越到 1000P,這中間的技術(shù)擴(kuò)跨度實(shí)在是太大,從處理器到互聯(lián)網(wǎng)絡(luò)都有質(zhì)的飛越,如果不謀求從美國獲取技術(shù),這對(duì)于日本來說未必不是一個(gè)挑戰(zhàn)。


目前,中國三家單位同時(shí)開展了 1000P 超算的原型機(jī)研制,并計(jì)劃在 2020 年建成 1000P 超算。考慮到中國在過去幾年中在超算上技術(shù)成果斐然,先后研制出曙光 6000、天河 1 號(hào)、天河 2 號(hào)、神威太湖之光等性能優(yōu)異的超算,中國很有可能領(lǐng)先日本完成 1000P 超算的建設(shè)。

更多最新行業(yè)資訊,歡迎點(diǎn)擊與非網(wǎng)《今日大事要聞》

相關(guān)推薦

電子產(chǎn)業(yè)圖譜