業(yè)界很多人都認(rèn)為,摩爾定律已死,但是英特爾是摩爾定律的提出者,也是其踐行者,只有英特爾用實際行動證明摩爾定律依然有效,才最有說服力。近期,在英特爾的媒體“紛享會”上,英特爾中國研究院院長宋繼強(qiáng)表示,“英特爾在持續(xù)推動摩爾定律的演進(jìn),目前,英特爾已經(jīng)讓制程回歸兩年的更新周期。新一輪 10nm 的創(chuàng)新產(chǎn)品已經(jīng)陸續(xù)問世,良品率大幅度提升,產(chǎn)能也大幅提升。在 10nm 上,產(chǎn)品可以獲得大規(guī)模的算力,同時大幅降低功耗。未來,英特爾還將以極快的速度過渡到更先進(jìn)的 7nm 工藝,2021 年會有產(chǎn)品首發(fā)?!?/p>
另外,為了加速推動計算架構(gòu)的創(chuàng)新,英特爾推出了全新的 Xe架構(gòu)。宋繼強(qiáng)介紹,“這是一個靈活且擴(kuò)展性很強(qiáng)的統(tǒng)一架構(gòu),還可以分成多種微架構(gòu)。應(yīng)用領(lǐng)域包括百億億次高性能計算、人工智能深度學(xué)習(xí)與訓(xùn)練、云服務(wù)、多媒體編輯、工作站、游戲、輕薄筆記本、便攜設(shè)備等。2019 年,我們展示了一款全新類別、兼具高性能和高靈活性的獨立通用型 GPU,研發(fā)代號為‘Ponte Vecchio’,這是首款基于 Xe架構(gòu)的通用 GPU,它采用了 7nm 制程工藝、最新的 Foveros 封裝技術(shù),以及基于 CXL 這一最新的芯片之間連接的標(biāo)準(zhǔn)。Ponte Vecchio 專為 HPC 高性能計算建模、模擬工作負(fù)載、人工智能訓(xùn)練而設(shè)計。另外,DG1 是首款基于 Xe架構(gòu)的獨立圖形顯卡。它具有極高的能效,針對游戲和內(nèi)容創(chuàng)作內(nèi)容部分能實現(xiàn)更好的優(yōu)化。”
英特爾可以在一個架構(gòu)上,從向上、向下分別延展,支持多種不同領(lǐng)域的應(yīng)用。有了先進(jìn)的制程和架構(gòu),就可以生產(chǎn)出低功耗、高性能的 CPU 和 GPU 產(chǎn)品。但是,當(dāng)用戶要將這些產(chǎn)品與其它 I/O 模塊、通訊模塊、電源管理模塊整合在一起時,如何能夠達(dá)到更好的面積、能效比?這就需要依靠先進(jìn)封裝技術(shù)。
英特爾有兩種先進(jìn)封裝技術(shù) EMIB 和 Foveros。Foveros 3D 堆疊封裝技術(shù),可以通過在水平布置的芯片之上垂直安置更多面積更小、功能更簡單的小芯片來讓方案整體具備更完整的功能。除了功能性的提升,F(xiàn)overos 技術(shù)還可以將過去漫長的重新設(shè)計、測試、流片過程都省去,直接將不同 IP、不同工藝的各種成熟方案封裝在一起,從而大幅降低成本,并提升產(chǎn)品上市速度。
同時,英特爾還推出了將 EMIB 和 Foveros 技術(shù)相結(jié)合的創(chuàng)新應(yīng)用技術(shù)——Co-EMIB。Co-EMIB 技術(shù)是 EMIB 和 Foveros 兩項技術(shù)的結(jié)合,在水平同物理層互連和垂直互連同時,實現(xiàn) Foveros 3D 堆疊之間的水平互連。這樣不管是 2D 水平互連還是 3D 堆疊互連,單片與單片之間都可以實現(xiàn)近乎于 SoC 級高度整合的低功耗、高帶寬、高性能表現(xiàn),為芯片封裝帶來絕佳的靈活性。如果將一塊 Foveros 堆疊的芯片看作是一個堆疊樓層的“摩天大樓”,那么,Co-EMIB 就可以看作兩個不同 Foveros 堆棧之間的“天橋”。
此外,英特爾還在推動超異構(gòu)計算實現(xiàn)。通過 XPU 的異構(gòu)整合和 oneAPI 實現(xiàn)軟硬協(xié)同,加速實現(xiàn)超異構(gòu)計算。XPU 可以包含 CPU、GPU、FPGA 等多種不同的架構(gòu),oneAPI 則是通過一套軟件接口、一套功能庫為開發(fā)者提供不同架構(gòu)上的編程便利性,同時保護(hù)已經(jīng)開發(fā)過的程序在架構(gòu)演進(jìn)過程中不需要重新開發(fā),從而輕易地遷移到未來的架構(gòu)上。這種軟硬結(jié)合在推動超異構(gòu)計算愿景的實現(xiàn)。
宋繼強(qiáng)舉了“極光”(Aurora)超算架構(gòu)的例子,這是超異構(gòu)計算愿景的完美呈現(xiàn)。它采用了兩個 10nm 的至強(qiáng)可擴(kuò)展處理器和 6 個 Xe架構(gòu)的 Ponte Vecchio GPU,同時內(nèi)存也采用了幾個不同層級的內(nèi)存技術(shù),并通過 oneAPI 將底下不同的架構(gòu)能力展現(xiàn)出來,在不同的處理器之間通過 CXL 這種技術(shù)互相連接,在每個構(gòu)成超算體系大的模塊之間,英特爾用另外一種模塊之間連接的技術(shù)把它互相連接起來,這個超算架構(gòu)會應(yīng)用于能源領(lǐng)域的高性能計算中。