国产男女无遮挡猛进猛出,国产精品一国产精品

本文中，英特爾院士 Aditya Navale 將分享圖形處理器從實現(xiàn)更好的像素繪制到解決人類復(fù)雜計算挑戰(zhàn)的演進歷程。

- Aditya Navale，英特爾院士，GPU 核心 IP 架構(gòu)總監(jiān)

事實上，我們和大家一樣期待英特爾進軍獨立顯卡市場。

英特爾院士 Aditya Navale 表示：“我一直希望英特爾能夠進入獨顯市場?！盇ditya Navale 在英特爾工作了 30 年，其中 20 多年都深耕于圖形技術(shù)。

不久前，英特爾發(fā)布了英特爾銳炫? 移動端獨立顯卡，并將在今年推出應(yīng)用于臺式機的獨立顯卡。這標(biāo)志著英特爾在顯卡進程中邁出了重要的一步。在加速計算系統(tǒng)與圖形事業(yè)部，Navale 的團隊至關(guān)重要——他們開發(fā)的核心 IP 架構(gòu)為多代英特爾 GPU 奠定了基礎(chǔ)，包括已經(jīng)推出的首款英特爾銳炫 A 系列獨立顯卡。

如果我們把集成顯卡（通常與 CPU 集成在同一裸片上）也一起算進來，英特爾已位居 PC 顯卡市場份額的領(lǐng)先地位。Navale 表示：“對于英特爾而言，從集成顯卡到獨立顯卡是重要的一步，因為這是一項極具挑戰(zhàn)性的復(fù)雜任務(wù)?！?/p>

自 2019 年以來，英特爾集成顯卡的游戲性能已經(jīng)提升至原來的數(shù)倍，而英特爾銳炫獨立顯卡以集成顯卡技術(shù)為基礎(chǔ)，再次實現(xiàn)了游戲性能的顯著提升。當(dāng)前的英特爾集成顯卡最多包含 96 個執(zhí)行單元，而銳炫獨立顯卡將采用多達 512 個 Xe 矢量引擎。Navale 指出：“在面積增大 5 倍以上的同時，我們需要克服的挑戰(zhàn)是，在特定功率范圍內(nèi)更好地提升性能?！?/p>

“除了進軍獨顯市場并成為重要的一員，我們開發(fā)銳炫顯卡的其中一個想法也是希望探索大型 GPU 的架構(gòu)設(shè)計和軟件開發(fā)。”他解釋道。

作為獨顯領(lǐng)域的“新人”，想要成為具有競爭力的新選擇，就意味著產(chǎn)品的特性和性能不僅要有吸引力，還需支持一系列的游戲和應(yīng)用?！败浖橄鹊睦砟钜恢彬?qū)動著我們的架構(gòu)創(chuàng)新?！彼f道。

從像素繪制到深度學(xué)習(xí)

什么推動了人們對于數(shù)倍于普通筆記本電腦圖形處理能力的需求？答案是豐富的對照研究。

GPU 的主要任務(wù)是加速圖形渲染：在 2D 屏幕上創(chuàng)建 2D 和 3D 圖像。簡言之，GPU 就是負(fù)責(zé)在屏幕上繪制像素。CPU 旨在一次處理一兩個復(fù)雜任務(wù)，而 GPU 旨在并行處理許多小任務(wù)，即繪制像素。

比如當(dāng)你閱讀這篇文章時，屏幕上的像素并沒有太大變化，所以 GPU 不需要做太多工作。但當(dāng)系統(tǒng)運行逼真的 3D 游戲等任務(wù)時，像素就會不斷變化。Navale 解釋道：“越是想在游戲中呈現(xiàn)身臨其境的沉浸感，GPU 需要做的工作就越多?！睙o論是微風(fēng)中飄動的毛發(fā)，還是不同程度的光影效果，這些細節(jié)都需要在每一個像素的顯示上花費更多功夫。并且為了保證細節(jié)渲染的流暢度，這些工作需要快速地完成。

游戲僅僅是一個開始。

GPU 是可用于高度并行計算的數(shù)據(jù)處理器，Navale 表示：“GPU 的應(yīng)用場景也正在快速增長?！背死L制像素，GPU 在人工智能、深度學(xué)習(xí)和高性能計算等領(lǐng)域的應(yīng)用也正在幫助人類解決復(fù)雜的計算挑戰(zhàn)。

如果說面向不同負(fù)載開發(fā)芯片聽起來很復(fù)雜，Navale 表示，那么基于 GPU 構(gòu)建的軟件生態(tài)則為以上困境提供了“解決之道”。

“我們構(gòu)建了一個滿足所有新要求的軟件生態(tài)?！?Navale 說，“考慮到高性能計算、人工智能和游戲等諸多領(lǐng)域的需求，軟件生態(tài)需要以一種高度協(xié)同的方式不斷演進。為此，我們需要在深思熟慮之后不斷完善架構(gòu)?！?/p>

GPU的需求成倍增長——邁向 Z 級計算

人們對 GPU 的需求正在成倍增長，因此我們需要依靠靈活性和新的設(shè)計思路，來將 GPU的性能提升至全新高度?！拔覀儗?gòu)建和部署 IP，確保其既可應(yīng)用于集成領(lǐng)域，也可應(yīng)用到大型獨顯中?！?Navale 說，“這種可擴展性是內(nèi)置的。我們還完成了大量的參數(shù)化工作，以便輕松快速實現(xiàn)它的可擴展性?！?/p>

為了實現(xiàn) Z 級超級計算，即全球下一個重要的強大算力系統(tǒng)，他解釋道：“產(chǎn)品的可擴展性還將進一步提升。”這不僅意味著每個芯片的算力要成倍增加，還要讓多個芯片進行系統(tǒng)級封裝。

“Ponte Vecchio 在這方面已經(jīng)取得了一些進展”，它將 47 個不同的區(qū)塊（tile）組合到單個 GPU 中?！暗乾F(xiàn)在這種模式還在發(fā)展，隨著我們向前邁進，它將取得更好的勢頭和采用情況?！?/p>