NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛,給COMPUTEX大會帶來了一場極具“松弛感”的主題演講。回到出生地的他,不論是逛夜市、吃美食還是登臺演講,都顯得放松且親切。他在演講中不僅談到了自己的“夜市情結(jié)”,還回憶了童年的夜市“趣事”……
演講中,黃仁勛詳細介紹了新的芯片平臺、軟件和系統(tǒng),它們將為新型數(shù)據(jù)中心、工廠、消費級設(shè)備、機器人等提供助力,此外,降低成本和可持續(xù)增長的重要性也是他著重強調(diào)的一點。歷數(shù)了加速計算的種種好處后,黃仁勛再現(xiàn)“名場面”:the more you buy, the more you save.
“夜市情結(jié)”和成為行業(yè)的“AI工廠”
身家已經(jīng)超過900億美元的黃仁勛,在這次公開演講中談到了自己的“夜市情結(jié)”。據(jù)他回憶,大約四五歲,他就非常喜歡去夜市,因為他喜歡在那里觀察人群。有一次,有人洗刀不小心割傷了他的臉,這道傷疤一直留在了他的臉上……即便如此,夜市對他來說依然有著很大的吸引力,直到現(xiàn)在他都喜歡去。
黃仁勛“插播”這個小故事時正講到了ChatGPT的變革。人都會有某些特別的想法或意圖,不同于以往的計算機應(yīng)用,ChatGPT能夠清楚理解人的意圖,并且像人類一樣與之互動。
2016年,黃仁勛親手將世界上第一臺DGX-1超級計算機交給Open AI后,使得Transformer能夠基于巨大的數(shù)據(jù)集進行訓練。直到2023年,ChatGPT橫空出世,業(yè)界現(xiàn)在開啟了由AI工廠驅(qū)動的新產(chǎn)業(yè)革命。
黃仁勛談到,幾乎每天都有新的AI模型被發(fā)明,且每一個行業(yè)都在導入AI大模型應(yīng)用。3萬億美元的IT行業(yè),首次將創(chuàng)造能夠直接服務(wù)于100萬億美元產(chǎn)業(yè)的價值,它不再僅僅是信息存儲或數(shù)據(jù)處理的工具,而是為每個行業(yè)生成智能的AI工廠。
算力通貨膨脹不能再繼續(xù),加速計算實現(xiàn)可持續(xù)增長
這一切,如果沒有加速計算會怎么樣?
黃仁勛指出,兩件根本性的事情在發(fā)生:第一,中央處理單元(CPU)——計算機行業(yè)運行的核心部件,其性能擴展已經(jīng)大幅放緩;第二,我們不得不進行的計算量,仍然在非常迅速地呈指數(shù)級翻倍。
“處理需求指數(shù)級增長,而性能卻沒有跟上,我們正在經(jīng)歷計算能力的通貨膨脹。全世界數(shù)據(jù)中心的電力在大幅增長,計算成本正在上升,這種情況不能繼續(xù)下去。這也是為什么,近二十年來,我們一直在致力于加速計算”,黃仁勛表示,“我們應(yīng)該加速一切,每一個處理密集型的應(yīng)用都將被加速?!?/p>
NVIDIA通過CPU與GPU的組合實現(xiàn)了這一點。由GPU加速所實現(xiàn)的100個時間單位的節(jié)約,也就是實現(xiàn)100倍速度的提升,相應(yīng)所需付出的是3倍功耗、1.5倍成本。此處黃仁勛再次加入了那句經(jīng)典廣告詞“The more you buy…The more you save”,他強調(diào),加速計算可顯著節(jié)約成本和能源,實現(xiàn)可持續(xù)的增長。
Blackwell——新產(chǎn)業(yè)革命的引擎
黃仁勛在演講中提到,偉大的智慧是退后一步。在生成式AI的熱潮來臨之前,他需要思考:人工智能的背景是什么?深度學習的基礎(chǔ)是什么?長期的影響是什么?它的潛力是什么?……
當他意識到這項技術(shù)有很大的潛力去擴展一個算法實現(xiàn)的時候,他認為這將需要更多的數(shù)據(jù)、更大規(guī)模的網(wǎng)絡(luò),非常重要的是——更多的計算能力,而Blackwell就是為了這一代AI而設(shè)計的。
Computex期間,NVIDIA與全球多家計算機制造商發(fā)布一系列采用Blackwell 架構(gòu)的系統(tǒng),這些系統(tǒng)搭載了Grace CPU 以及 NVIDIA 網(wǎng)絡(luò)和基礎(chǔ)設(shè)施。永擎電子、華碩、技嘉、鴻佰科技、英業(yè)達、和碩、QCT、Supermicro、緯創(chuàng)資通和緯穎將使用 NVIDIA GPU 和網(wǎng)絡(luò)打造云、專用系統(tǒng)、嵌入式和邊緣 AI 系統(tǒng)。
黃仁勛表示,“從服務(wù)器、網(wǎng)絡(luò)和基礎(chǔ)設(shè)施制造商到軟件開發(fā)商,整個行業(yè)正在準備使用 Blackwell 來加速各個領(lǐng)域?qū)崿F(xiàn) AI 驅(qū)動的創(chuàng)新?!?/p>
為了滿足各類應(yīng)用的需求,所發(fā)布的產(chǎn)品配置非常豐富,涵蓋了從單 GPU 到多 GPU、從 x86到Grace、從風冷到液冷技術(shù)等。
此外,為了加快不同規(guī)模和配置的系統(tǒng)開發(fā),NVIDIA MGX 模塊化參考設(shè)計平臺加入了對 NVIDIA Blackwell 產(chǎn)品的支持,包括全新 NVIDIA GB200 NVL2 平臺,該平臺專為主流大語言模型推理、檢索增強生成和數(shù)據(jù)處理提供卓越的性能而打造。借助 NVLink-C2C 互連技術(shù)帶來的高帶寬內(nèi)存性能和Blackwell 架構(gòu)中專有的解壓縮引擎,較使用x86 CPU時數(shù)據(jù)處理速度可提速最多達18倍,能效提高了8倍。
值得一提的是,AMD和英特爾都支持MGX 架構(gòu),并首次計劃打造基于他們自己 CPU 主機處理器的模塊設(shè)計,其中包括下一代 AMD Turin 平臺和基于P核心的第六代英特爾至強處理器(原 Granite Rapids)。服務(wù)器系統(tǒng)廠商可以借助這些參考設(shè)計節(jié)省開發(fā)時間,并確保設(shè)計和性能的一致性。
“人工智能的出現(xiàn)之所以成為可能,是因為我們有這樣一種堅定的信念:如果我們使計算成本越來越低,總會有人實現(xiàn)它的偉大用途。如今,我們已經(jīng)實現(xiàn)了一個循環(huán):部署基礎(chǔ)在增長、計算成本在下降,這驅(qū)動更多的開發(fā)者提出更多的創(chuàng)意,從而推動了更多的需求……現(xiàn)在我們正處于一個非常重要、非常重要的開始階段”,他強調(diào)。
在Blackwell出現(xiàn)之前,Hopper平臺可能是歷史上最成功的數(shù)據(jù)中心處理器。但是對于生成式AI應(yīng)用來說, NVIDIA構(gòu)建了整個包括CPU、GPU、網(wǎng)絡(luò)連接等在內(nèi)的平臺,使Blackwell成為了新的產(chǎn)業(yè)引擎。
“8年內(nèi),我們使用Blackwell,將原本的1000千兆瓦時減少到了3千瓦時,這是一個令人難以置信的進步”,黃仁勛表示,“我們不會就此止步。在這種難以置信的增長期間,我們要確保繼續(xù)提高性能、繼續(xù)降低訓練成本、推理成本,并繼續(xù)擴大AI能力,讓每個公司都擁抱它?!?/p>
公布最新路線圖,回應(yīng)網(wǎng)絡(luò)平臺演進方向
“我們公司的更新節(jié)奏是以年為單位。我們的基本理念非常簡單:打造數(shù)據(jù)中心規(guī)模,以每年的節(jié)奏分步驟實現(xiàn)、并向客戶交付產(chǎn)品,在各個領(lǐng)域?qū)崿F(xiàn)技術(shù)突破,”黃仁勛解釋道。
他“劇透”了最新的技術(shù)路線圖,該路線圖將每年更新。根據(jù)這一發(fā)布,我們可以看到NVIDIA將在明年推出增強版Blackwell Ultra GPU(配備8S HBM3e 12H)和Spectrum Ultra X800(Ethernet Switch 512 Radix)。
繼加速計算能力的比拼之外,很顯然,網(wǎng)絡(luò)正在成為新的競爭焦點,特別是在以太網(wǎng)方面,多家行業(yè)巨頭正在結(jié)成聯(lián)盟。對于NVIDIA來說,其網(wǎng)絡(luò)平臺除了要考慮配合GPU的升級,同時也要面臨業(yè)界的激烈競爭。這將如何推動NVIDIA網(wǎng)絡(luò)平臺的演進?核心的競爭點是什么?
對此,NVIDIA對<與非網(wǎng)>進行了回應(yīng):為了滿足行業(yè)對性能的強烈需求,NVIDIA 計劃每年推出新的Spectrum-X 產(chǎn)品,提供更高的帶寬和端口,以及增強的軟件功能集和可編程性,以推動領(lǐng)先的AI以太網(wǎng)網(wǎng)絡(luò)性能。NVIDIA持續(xù)的性能改進節(jié)奏將建立在一系列關(guān)鍵創(chuàng)新之上,例如:自適應(yīng)路由、擁塞控制和高頻遙測等,這些創(chuàng)新加快了訓練時間,同時還提供了噪聲隔離、彈性和可編程性等優(yōu)勢。
NVIDIA方面強調(diào),這些功能是他們所獨有的,依賴于Spectrum交換機和NVIDIA BlueField 或 ConnectX SuperNIC 的專業(yè)化和差異化架構(gòu),同時保持完全以太網(wǎng)兼容,從而實現(xiàn)與現(xiàn)有數(shù)據(jù)中心基礎(chǔ)設(shè)施的無縫集成。
此外,黃仁勛首次透露了Blackwell 的下一代平臺Rubin。預(yù)計2026年推出的Rubin平臺,將配備新 GPU、基于Arm的新CPU——Vera,以及采用 NVLink 6、CX9 SuperNIC 和 X1600、并融合 InfiniBand/以太網(wǎng)交換機的高級網(wǎng)絡(luò)平臺。
NVIDIA NIM讓數(shù)百萬人成為生成式AI開發(fā)者
在生成式AI推動的全棧重塑中,一個變革也在發(fā)生——計算機不再是我們使用的一個工具,它將具有生成AI的能力。
黃仁勛宣布,借助NVIDIA NIM推理微服務(wù),全球2800萬開發(fā)者都可以創(chuàng)建生成式AI應(yīng)用。NIM 還能幫助企業(yè)實現(xiàn)基礎(chǔ)設(shè)施投資的效果最大化。例如,與未使用NIM的情況相比,在NIM中運行 Meta Llama 3-8B 所能生成的加速基礎(chǔ)設(shè)施AI token可以提升3倍。
Cadence、Cloudera、Cohesity、DataStax、NetApp、Scale AI 和新思科技等近 200 家技術(shù)合作伙伴正將 NIM 集成到他們的平臺中,加快生成式 AI 部署到特定領(lǐng)域應(yīng)用中的速度,例如copilots、代碼助手、數(shù)字人虛擬形象等。從 Meta Llama 3 開始,在 Hugging Face上現(xiàn)已開始提供 NIM。
AI的下一波浪潮——物理AI
在演講進入尾聲時,黃仁勛強調(diào)了機器人和人工智能在未來發(fā)展中的重要性。他指出,“AI 的新一波浪潮是物理AI。AI能夠理解物理定律,并與人類并肩作戰(zhàn)。”
NVIDIA Isaac 平臺為開發(fā)者構(gòu)建AI機器人提供強大的套件,包括由 AI 模型以及Jetson Orin、Thor 等超級計算機驅(qū)動的 AMR、工業(yè)機械臂和人形機器人。
黃仁勛也強調(diào)了NVIDIA Isaac在提高工廠和倉庫效率方面的作用,比亞迪電子、西門子、泰瑞達、Intrinsic 等企業(yè)都在使用 NVIDIA Isaac 的高級程序庫和 AI 模型。
“機器人將遍布所有工廠。工廠將實現(xiàn)對機器人的統(tǒng)籌,而這些機器人將制造新的機器人產(chǎn)品,”黃仁勛表示,“機器人和物理AI正在成為現(xiàn)實,而不僅是出現(xiàn)在科幻小說?!?/p>