本文中,英特爾院士 Aditya Navale 將分享圖形處理器從實現(xiàn)更好的像素繪制到解決人類復(fù)雜計算挑戰(zhàn)的演進歷程。
- Aditya Navale,英特爾院士,GPU 核心 IP 架構(gòu)總監(jiān)
事實上,我們和大家一樣期待英特爾進軍獨立顯卡市場。
英特爾院士 Aditya Navale 表示:“我一直希望英特爾能夠進入獨顯市場?!盇ditya Navale 在英特爾工作了 30 年,其中 20 多年都深耕于圖形技術(shù)。
不久前,英特爾發(fā)布了英特爾銳炫? 移動端獨立顯卡,并將在今年推出應(yīng)用于臺式機的獨立顯卡。這標(biāo)志著英特爾在顯卡進程中邁出了重要的一步。在加速計算系統(tǒng)與圖形事業(yè)部,Navale 的團隊至關(guān)重要——他們開發(fā)的核心 IP 架構(gòu)為多代英特爾 GPU 奠定了基礎(chǔ),包括已經(jīng)推出的首款英特爾銳炫 A 系列獨立顯卡。
如果我們把集成顯卡(通常與 CPU 集成在同一裸片上)也一起算進來,英特爾已位居 PC 顯卡市場份額的領(lǐng)先地位。Navale 表示:“對于英特爾而言,從集成顯卡到獨立顯卡是重要的一步,因為這是一項極具挑戰(zhàn)性的復(fù)雜任務(wù)?!?/p>
自 2019 年以來,英特爾集成顯卡的游戲性能已經(jīng)提升至原來的數(shù)倍,而英特爾銳炫獨立顯卡以集成顯卡技術(shù)為基礎(chǔ),再次實現(xiàn)了游戲性能的顯著提升。當(dāng)前的英特爾集成顯卡最多包含 96 個執(zhí)行單元,而銳炫獨立顯卡將采用多達 512 個 Xe 矢量引擎。Navale 指出:“在面積增大 5 倍以上的同時,我們需要克服的挑戰(zhàn)是,在特定功率范圍內(nèi)更好地提升性能?!?/p>
“除了進軍獨顯市場并成為重要的一員,我們開發(fā)銳炫顯卡的其中一個想法也是希望探索大型 GPU 的架構(gòu)設(shè)計和軟件開發(fā)。”他解釋道。
作為獨顯領(lǐng)域的“新人”,想要成為具有競爭力的新選擇,就意味著產(chǎn)品的特性和性能不僅要有吸引力,還需支持一系列的游戲和應(yīng)用?!败浖橄鹊睦砟钜恢彬?qū)動著我們的架構(gòu)創(chuàng)新?!彼f道。
從像素繪制到深度學(xué)習(xí)
什么推動了人們對于數(shù)倍于普通筆記本電腦圖形處理能力的需求?答案是豐富的對照研究。
GPU 的主要任務(wù)是加速圖形渲染:在 2D 屏幕上創(chuàng)建 2D 和 3D 圖像。簡言之,GPU 就是負(fù)責(zé)在屏幕上繪制像素。CPU 旨在一次處理一兩個復(fù)雜任務(wù),而 GPU 旨在并行處理許多小任務(wù),即繪制像素。
比如當(dāng)你閱讀這篇文章時,屏幕上的像素并沒有太大變化,所以 GPU 不需要做太多工作。但當(dāng)系統(tǒng)運行逼真的 3D 游戲等任務(wù)時,像素就會不斷變化。Navale 解釋道:“越是想在游戲中呈現(xiàn)身臨其境的沉浸感,GPU 需要做的工作就越多?!睙o論是微風(fēng)中飄動的毛發(fā),還是不同程度的光影效果,這些細節(jié)都需要在每一個像素的顯示上花費更多功夫。并且為了保證細節(jié)渲染的流暢度,這些工作需要快速地完成。
游戲僅僅是一個開始。
GPU 是可用于高度并行計算的數(shù)據(jù)處理器,Navale 表示:“GPU 的應(yīng)用場景也正在快速增長?!背死L制像素,GPU 在人工智能、深度學(xué)習(xí)和高性能計算等領(lǐng)域的應(yīng)用也正在幫助人類解決復(fù)雜的計算挑戰(zhàn)。
如果說面向不同負(fù)載開發(fā)芯片聽起來很復(fù)雜,Navale 表示,那么基于 GPU 構(gòu)建的軟件生態(tài)則為以上困境提供了“解決之道”。
“我們構(gòu)建了一個滿足所有新要求的軟件生態(tài)?!?Navale 說,“考慮到高性能計算、人工智能和游戲等諸多領(lǐng)域的需求,軟件生態(tài)需要以一種高度協(xié)同的方式不斷演進。為此,我們需要在深思熟慮之后不斷完善架構(gòu)?!?/p>
GPU的需求成倍增長——邁向 Z 級計算
人們對 GPU 的需求正在成倍增長,因此我們需要依靠靈活性和新的設(shè)計思路,來將 GPU的性能提升至全新高度?!拔覀儗?gòu)建和部署 IP,確保其既可應(yīng)用于集成領(lǐng)域,也可應(yīng)用到大型獨顯中?!?Navale 說,“這種可擴展性是內(nèi)置的。我們還完成了大量的參數(shù)化工作,以便輕松快速實現(xiàn)它的可擴展性?!?/p>
為了實現(xiàn) Z 級超級計算,即全球下一個重要的強大算力系統(tǒng),他解釋道:“產(chǎn)品的可擴展性還將進一步提升。”這不僅意味著每個芯片的算力要成倍增加,還要讓多個芯片進行系統(tǒng)級封裝。
“Ponte Vecchio 在這方面已經(jīng)取得了一些進展”,它將 47 個不同的區(qū)塊(tile) 組合到單個 GPU 中?!暗乾F(xiàn)在這種模式還在發(fā)展,隨著我們向前邁進,它將取得更好的勢頭和采用情況?!?/p>