來(lái)源:雷科技AI硬件組?|?編輯:天星?|?排版:Czy
2024 年 8 月,國(guó)產(chǎn)游戲《黑神話:悟空》正式開(kāi)售。作為近期熱度最高的國(guó)產(chǎn)游戲,《黑神話》憑借出色的劇情發(fā)展、場(chǎng)景設(shè)計(jì)和配樂(lè)成功“出圈”,不僅游戲愛(ài)好者們“人手一份”,不少已經(jīng)“戒游戲”的老玩家也選擇趁機(jī)升級(jí)電腦,換張新顯卡好好享受游戲。
盡管這種為了游戲而換顯卡的行為看起來(lái)有“沖動(dòng)消費(fèi)”的意思,但回顧近幾年的游戲史,我們不難發(fā)現(xiàn),每次現(xiàn)象級(jí)游戲走火,同時(shí)也有大量玩家為此升級(jí)顯卡。比如用豐富游戲性推動(dòng) GTX 1060 顯卡的《PUBG》和《守望先鋒》,用出色營(yíng)銷(xiāo)和畫(huà)質(zhì)推動(dòng) RTX 時(shí)代的《賽博朋克 2077》,成為 RTX 4060“帶貨王”的《Apex》。可以說(shuō)每一款成功游戲的背后,都有一張“現(xiàn)象級(jí) N 卡”。
那么問(wèn)題也隨之而來(lái)——英偉達(dá)第一張游戲顯卡面世時(shí),游戲行業(yè)是怎樣的呢?1999 年,英偉達(dá)發(fā)布了其第一張游戲顯卡——GeForce 256。但在 GeForce 256 發(fā)布之前,市場(chǎng)上已經(jīng)存在多個(gè)顯卡(GPU)品牌,如 3dfx 的 Voodoo(巫毒)系列、Matrox(邁創(chuàng))、S3 Graphics、ATI 的 Rage 系列。
和現(xiàn)代的 GPU 一樣,這些 GPU 同樣基于 3D 加速技術(shù),但可惜的是,這些 GPU 產(chǎn)品缺乏統(tǒng)一的 3D 加速制式。這意味著游戲開(kāi)發(fā)者必須針對(duì)不同顯卡優(yōu)化游戲,顯著增加了開(kāi)發(fā)成本和難度。此外受產(chǎn)品性能的限制,這些 GPU 也無(wú)法支撐復(fù)雜的 3D 游戲。與此同時(shí),《古墓麗影》、《雷神之錘2》、《星際爭(zhēng)霸》等游戲的流行也推動(dòng)了玩家對(duì) 3D 游戲的期望。也就在這時(shí),英偉達(dá) GeForce 256 出現(xiàn)了。
GPU計(jì)算爆發(fā),都有哪些先行者?
GeForce 256 是全球首款被稱(chēng)為 GPU 的產(chǎn)品,源于其首次將圖形處理的多個(gè)功能集成于單一芯片,這一行為定義了 GPU 這一概念,同時(shí)也將復(fù)雜的 3D 渲染任務(wù)從 CPU 中解放出來(lái),賦予 GPU 專(zhuān)門(mén)的計(jì)算職責(zé)。從 GPU 的歷史進(jìn)程來(lái)看,這也為后來(lái) GPU 的廣泛應(yīng)用奠定了基礎(chǔ)。
此外,GeForce 256 也將 T&L(Transform & Lighting、變換與光照)硬件加速集成到 GPU 中,使 3D 場(chǎng)景的變換和光照計(jì)算由 GPU 專(zhuān)門(mén)負(fù)責(zé)。這是圖形處理史上的重大突破,以前這類(lèi)計(jì)算任務(wù)通常由 CPU 執(zhí)行,不僅效率低下,而且限制了游戲畫(huà)面的表現(xiàn)力。借助 GeForce 256,游戲畫(huà)面的復(fù)雜性和細(xì)節(jié)大幅提升,推動(dòng)了 3D 游戲時(shí)代的到來(lái)。而且 GeForce 256 出色的性能也將 GPU 這一概念帶到游戲行業(yè)之外。別著急,此時(shí)的英偉達(dá)還沒(méi)拿出 CUDA 這種改變 GPU 行業(yè)生態(tài)的大殺器。但 GeForce 256 出色的性能,確實(shí)為 GPU 在科學(xué)計(jì)算、金融分析等領(lǐng)域的應(yīng)用奠定了基礎(chǔ)。如果說(shuō) GeForce 256 開(kāi)啟了 GPU 圖形運(yùn)算的時(shí)代,那英偉達(dá)在 2008 年發(fā)布的 GeForce 8800 GTX,則真正解放了 GPU 的性能。很顯然這張顯卡的性能放在現(xiàn)在早已不值一提,但這張顯卡上,英偉達(dá)提出了 CUDA(統(tǒng)一計(jì)算架構(gòu))這一概念。CUDA 的出現(xiàn)讓 GPU 不僅可以用來(lái)處理圖形運(yùn)算,還可以用來(lái)執(zhí)行、加速基于 CUDA 的通用計(jì)算,讓電腦成為真正的通用工具。
而在提出了 CUDA 后,英偉達(dá)也在 2018 年進(jìn)一步對(duì) GPU 的算力進(jìn)行細(xì)化,引入了 RT Core、Tensor Core 的概念,讓光線追蹤和專(zhuān)門(mén)的 ML 計(jì)算成為可能——Tensor Core 通過(guò)高效執(zhí)行大規(guī)模矩陣運(yùn)算,顯著加快了 AI 模型的訓(xùn)練和執(zhí)行速度。根據(jù)英偉達(dá)的介紹,現(xiàn)階段 RTX AI 已經(jīng)對(duì) 10 種不同的 AI 場(chǎng)景實(shí)現(xiàn)覆蓋,包括游戲、影視、自動(dòng)駕駛和科學(xué)計(jì)算等領(lǐng)域。深受英偉達(dá)用戶喜愛(ài)、可以顯著提高游戲 FPS 的 DLSS,就基于 Tensor Core 來(lái)實(shí)現(xiàn),可以說(shuō)是廣大游戲玩家最早接觸到的真 AI 用例了。
在影視制作領(lǐng)域,RTX AI 加速渲染速度,使復(fù)雜的光線和反射效果在短時(shí)間內(nèi)完成,從而縮短了制作周期。在自動(dòng)駕駛方面,RTX GPU 處理大量圖像和傳感器數(shù)據(jù),支持實(shí)時(shí)決策,提高車(chē)輛的安全性與精準(zhǔn)性。此外,AI 還用于醫(yī)療影像處理、金融預(yù)測(cè)和科學(xué)模擬,加速數(shù)據(jù)分析和預(yù)測(cè)模型的訓(xùn)練。
不夸張的說(shuō),RTX AI 的出現(xiàn)不僅推動(dòng)了高端視覺(jué)效果和 AI 計(jì)算的融合,還降低了企業(yè)使用 AI 的門(mén)檻。它正逐漸成為各行業(yè)提升效率、創(chuàng)新業(yè)務(wù)的關(guān)鍵引擎,引領(lǐng)未來(lái)技術(shù)的發(fā)展潮流。
GPU計(jì)算驅(qū)動(dòng)AI,但AI計(jì)算不全靠GPU
但話說(shuō)回來(lái),盡管 GPU 的算力提升讓 AI 能以驚人的速度普及,現(xiàn)階段英偉達(dá)確實(shí)是 AI 算力的代名詞,以及個(gè)人 AI 計(jì)算機(jī)的唯一選擇。但這是否意味著美歐強(qiáng)勁 GPU 的設(shè)備,就無(wú)緣 AI 時(shí)代呢?
答案是否定的。在 2024 云棲大會(huì)上,阿里集團(tuán) CEO、阿里智能云董事長(zhǎng)兼 CEO 吳泳銘表示:
生成式 AI 改變計(jì)算架構(gòu),從 CPU 主導(dǎo)的計(jì)算體系到 GPU 主導(dǎo)的 AI 計(jì)算遷移。AI 時(shí)代將是“GPU 算力為主,CPU 算力為輔”的計(jì)算模式。2024 年市場(chǎng)新增算力,超過(guò) 50% 的需求 AI 驅(qū)動(dòng)產(chǎn)生,這一趨勢(shì)將持續(xù)擴(kuò)大。
不可否認(rèn),即使是阿里云提供的 AI 云算力,背后也主要由 GPU 驅(qū)動(dòng)。但從另一個(gè)方面想,將 GPU 算力集中在云端,配合設(shè)備本地的 CPU、NPU 進(jìn)行混合 AI 運(yùn)算,其實(shí)也不失為一個(gè)好主意。
首先,這可以緩解算力瓶頸,提升計(jì)算靈活性。GPU 在 AI 計(jì)算中的核心地位毋庸置疑,但個(gè)人開(kāi)發(fā)者和消費(fèi)者通常難以承受購(gòu)買(mǎi)和維護(hù)大量 GPU 的成本。將 GPU 算力集中在云端,允許用戶按需租用云 GPU 資源,可以避免一次性高額投入。這種模式也提供了極大的彈性,可根據(jù)任務(wù)需要隨時(shí)擴(kuò)展或縮減算力。
其次,許多終端設(shè)備受限于尺寸和功耗,無(wú)法配備高性能 GPU。通過(guò)在云端完成復(fù)雜的 AI 運(yùn)算,并將結(jié)果傳輸至本地設(shè)備執(zhí)行簡(jiǎn)單任務(wù),設(shè)備可以保持輕量化且功耗低。這種混合計(jì)算模式,特別適合邊緣設(shè)備和移動(dòng)終端。
而且在本地 CPU 和 NPU 的配合下,云 GPU 的計(jì)算能力可以得到最大化利用:設(shè)備本地的 NPU 可以快速處理延遲敏感的任務(wù),如語(yǔ)音識(shí)別和實(shí)時(shí)圖像分析;而復(fù)雜的模型訓(xùn)練和推理則交由云端 GPU 完成。這種模式有效縮短了計(jì)算響應(yīng)時(shí)間,提升了用戶體驗(yàn)。短時(shí)間來(lái)看,英偉達(dá)在 AI 算力市場(chǎng)的優(yōu)勢(shì)仍然巨大,但是長(zhǎng)遠(yuǎn)來(lái)看,群狼環(huán)伺之下的 AI 市場(chǎng),英偉達(dá)雙拳難敵四手。
諸如移動(dòng) PC、智能終端等英偉達(dá)的弱勢(shì)市場(chǎng),很快就會(huì)被其他廠商瓜分干凈,而關(guān)鍵的服務(wù)器市場(chǎng)也并非高枕無(wú)憂,AMD 的 MI300 系列 AI 顯卡份額增長(zhǎng)迅速,已經(jīng)足夠引起英偉達(dá)的警覺(jué)。不過(guò),競(jìng)爭(zhēng)所帶來(lái)的創(chuàng)新與發(fā)展,才是科技進(jìn)步的關(guān)鍵,隨著 AI 領(lǐng)域的競(jìng)爭(zhēng)加劇,實(shí)際上也在推動(dòng) AI 成本的下降,讓 AI 技術(shù)得到更快、更廣泛的應(yīng)用。就像吳泳銘說(shuō)的那樣:
AI 驅(qū)動(dòng)的數(shù)字世界連接著具備 AI 能力的物理世界,將會(huì)大幅提升整個(gè)世界的生產(chǎn)力,對(duì)物理世界的運(yùn)行效率產(chǎn)生革命性的影響。
一個(gè)圍繞 AI 而生的新生態(tài),此時(shí)此刻就在我們面前。