作者 |??ZeR0,編輯?|??漠影
AI做的第一件偉大的事,是縮小技術(shù)鴻溝。?
芯東西美國(guó)圣何塞3月19日現(xiàn)場(chǎng)報(bào)道,美國(guó)科技圈最矚目的AI技術(shù)盛會(huì)英偉達(dá)(NVIDIA)GTC大會(huì)正在火熱舉行。今日,英偉達(dá)創(chuàng)始人兼CEO黃仁勛在GTC大會(huì)上與芯東西等全球媒體進(jìn)行交流,回應(yīng)中美摩擦對(duì)英偉達(dá)的影響、對(duì)中國(guó)GPU產(chǎn)品出口計(jì)劃、Blackwell GPU的定價(jià)與銷售策略、臺(tái)積電CoWoS供需情況等20個(gè)關(guān)鍵問題。
英偉達(dá)最新發(fā)布的旗艦AI芯片Blackwell GPU為雙芯設(shè)計(jì)方案,而上一代H100、H200是單芯片方案,在定價(jià)上不好做出直接的對(duì)比。黃仁勛強(qiáng)調(diào)說,不同系統(tǒng)會(huì)存在價(jià)格差異,相比只賣芯片,英偉達(dá)盯上的是整個(gè)數(shù)據(jù)中心的生意。此外,據(jù)黃仁勛透露,在HBM3E競(jìng)爭(zhēng)中嚴(yán)重掉隊(duì)的三星已搭上英偉達(dá)這輛豪華巨輪——英偉達(dá)正在測(cè)試三星HBM,并宣布將使用它。這兩天,GTC大會(huì)肉眼可見地人氣爆棚,圣何塞會(huì)議中心周圍四處飄揚(yáng)著英偉達(dá)GTC大會(huì)的道旗廣告,街上到處都是佩帶標(biāo)志性英偉達(dá)綠badge的參會(huì)者。還有一些英偉達(dá)合作伙伴們花式助陣,比如宇樹科技派出機(jī)器狗陣隊(duì),當(dāng)街調(diào)戲美國(guó)本土狗;WEKA別出心裁地在附近街邊??苛藥纵v吸睛的紫色汽車,汽車前蓋上大字寫著“現(xiàn)已獲得NVIDIA DGX SuperPOD認(rèn)證”。
除了英偉達(dá)新品,黃仁勛還在接受媒體提問時(shí)分享了對(duì)OpenAI視頻生成模型Sora、OpenAI CEO Sam Altman擴(kuò)大芯片規(guī)模的計(jì)劃、怎么預(yù)測(cè)AGI時(shí)間表、AI是否會(huì)滅掉碼農(nóng)、如何回應(yīng)AI芯片創(chuàng)企Groq的叫囂的觀點(diǎn)。特別是與Groq的交鋒,快演成反轉(zhuǎn)電視劇了,昨天英偉達(dá)GTC主題演講剛結(jié)束,以碰瓷科技大佬出圈的大模型推理芯片創(chuàng)企Groq就發(fā)文,指名道姓地硬剛英偉達(dá)表態(tài):“依然更快”。今天Groq又追加一句“……而且也依然功耗更少”。
在媒體溝通會(huì)上,被問到對(duì)此事的看法時(shí),黃仁勛回應(yīng)說:“我真的不太了解,無法明智地作出評(píng)價(jià)……芯片的存在是用來實(shí)現(xiàn)軟件的。我們的工作是促進(jìn)下一個(gè)ChatGPT的發(fā)明。如果是Llama-7B,我會(huì)感到非常驚訝和震驚?!笔虑檫€沒完,Groq創(chuàng)始人兼CEO Jonathan Ross隨即在社交平臺(tái)上發(fā)文并曬出跟黃仁勛的合照:“我之前見過黃仁勛,他的團(tuán)隊(duì)本周專門更新了GTC,以回應(yīng)Groq,所以對(duì)Groq不太了解似乎不太可能。也就是說,***Groq運(yùn)行700億參數(shù)模型的速度比英偉達(dá)運(yùn)行70億參數(shù)模型的速度快。***體驗(yàn)一下:groq.com”
鋒芒畢露的美國(guó)AI芯片公司們顯然對(duì)GTC高度重視并緊密關(guān)注。最近剛發(fā)布第三代晶圓級(jí)芯片的Cerebras,今日在距離GTC展區(qū)步行不到10分鐘的地方舉辦Cerebras AI Day,在這里宣布“擁有4萬(wàn)億顆晶體管的世界最快AI芯片CS-3”、“選擇高通在AI推理中提供前所未有的性能”、算力達(dá)8EFLOPS的AI超級(jí)計(jì)算機(jī)G42破土動(dòng)工,并分享了晶圓級(jí)架構(gòu)的核心、AI能力鴻溝、GPU挑戰(zhàn)、大模型在大芯片上訓(xùn)練得最好、新的多模態(tài)大模型發(fā)布。
Cerebras不忘發(fā)文踩一腳GPU:“在CS-3上,與GPU相比,我們能夠以數(shù)量級(jí)的性能優(yōu)勢(shì)進(jìn)行大規(guī)模訓(xùn)練。但即便是我們最大的集群本身也是作為單個(gè)設(shè)備運(yùn)行的……現(xiàn)在鼓掌!”
以下是黃仁勛媒體溝通會(huì)20個(gè)問答(為方便閱讀,部分問題及回答在盡可能不違背原意的前提下進(jìn)行了精編處理):
01.中美摩擦,對(duì)英偉達(dá)的影響有多大?
1、中美緊張局勢(shì)如何影響生產(chǎn)制造和系統(tǒng)?黃仁勛回答說:“是的,有兩件事我們必須做,一是確保我們理解并遵守政策,二是盡我們所能地增強(qiáng)供應(yīng)鏈的彈性。”世界供應(yīng)鏈很復(fù)雜,他舉例說,HGX有35000個(gè)零件,其中8個(gè)零件來自臺(tái)積電,其它中很大一部分來自中國(guó),汽車和國(guó)防行業(yè)也是如此。他相信各國(guó)的目標(biāo)并不是對(duì)立的:“世界末日的情景不太可能發(fā)生,我希望這不會(huì)發(fā)生。我們能做的事情與彈性和合規(guī)性相關(guān)。”
2、英偉達(dá)與臺(tái)積電的關(guān)系過去兩年如何發(fā)展,包括芯片、封裝以及Blackwell雙芯設(shè)計(jì)?黃仁勛稱英偉達(dá)與臺(tái)積電的合作關(guān)系是“業(yè)界最密切的合作關(guān)系之一”。英偉達(dá)做的事情很難,但臺(tái)積電做得很好。英偉達(dá)有計(jì)算die、CPU die、GPU die、CoWoS基板,內(nèi)存來自美光、SK海力士、三星,在臺(tái)灣組裝。供應(yīng)鏈并不簡(jiǎn)單。這需要大公司的協(xié)調(diào),替英偉達(dá)做這件事?!八麄円惨庾R(shí)到需要更多的CoWoS。我們會(huì)全部解決的?!彼劦?,跨公司協(xié)作是好的,你組裝它們,另一家公司負(fù)責(zé)測(cè)試,再由另一家公司來構(gòu)建系統(tǒng),你需要一臺(tái)超級(jí)計(jì)算機(jī)來測(cè)試超級(jí)計(jì)算機(jī),制造層是一個(gè)巨大的數(shù)據(jù)中心?!癇lackwell是個(gè)奇跡,但我們必須在系統(tǒng)層面實(shí)現(xiàn)它。人們問我是否像SoC一樣制造GPU,但我看到的是機(jī)架、電纜和開關(guān),這是我對(duì)GPU的心理模型。臺(tái)積電對(duì)我們至關(guān)重要。”黃仁勛說。
3、對(duì)于臺(tái)積電,企業(yè)總是想要得到更多,能談?wù)劷衲昝髂昴暧ミ_(dá)的供需情況嗎?比如今年英偉達(dá)的CoWoS需求是去年的3倍?“你想要確切的數(shù)字,很有意思?!秉S仁勛說,英偉達(dá)今年對(duì)CoWoS需求非常高,明年會(huì)更高,因?yàn)檎幱贏I轉(zhuǎn)型的開始階段——只有1000億美元投入這一旅程,還有很長(zhǎng)的路要走。黃仁勛對(duì)臺(tái)積電的增長(zhǎng)非常有信心,稱他們是很好的合作伙伴,理應(yīng)成為現(xiàn)在的樣子。他認(rèn)為人們工作得非常努力,技術(shù)處在完美的位置。生成式AI正處于不可思議的位置。
4、英偉達(dá)新的網(wǎng)絡(luò)技術(shù)計(jì)劃出售給中國(guó)多少、能否告知中國(guó)在計(jì)算芯片上集成其他技術(shù)的具體傾向?黃仁勛說:“我今年幾乎沒宣布過,有點(diǎn)貪心了哈。這是我們要宣布的。無論何時(shí)何地賣給中國(guó),當(dāng)然有出口管制,所以我們就會(huì)考慮這個(gè)問題。對(duì)于中國(guó),我們有L20和H20。我們正在盡最大努力為中國(guó)某些客戶優(yōu)化它?!?/p>
5、當(dāng)云計(jì)算廠商紛紛開始自研芯片,英偉達(dá)正轉(zhuǎn)向云業(yè)務(wù),你怎么看這一現(xiàn)象?他們自研芯片會(huì)影響價(jià)格嗎?英偉達(dá)在中國(guó)的云計(jì)算戰(zhàn)略和解決方案是什么?黃仁勛解答說,英偉達(dá)生產(chǎn)HGX,然后賣給戴爾,戴爾把它放進(jìn)計(jì)算機(jī)里,再賣出去。英偉達(dá)開發(fā)了在戴爾(設(shè)備)上運(yùn)行的軟件,創(chuàng)造了市場(chǎng)需求,來幫助銷售這些計(jì)算機(jī)。“我們與云服務(wù)提供商合作,將NVIDIA Cloud放到他們的云中?!彼麖?qiáng)調(diào)說,“我們不是云計(jì)算公司,我們的云叫DGX Cloud,但實(shí)際上我們是他們?cè)浦械囊粏T,我們的目標(biāo)是把客戶帶到云上,讓客戶在這臺(tái)機(jī)器上交易?!薄拔覀儗⑴囵B(yǎng)開發(fā)者,我們將創(chuàng)造對(duì)云服務(wù)的需求。”他談道,“這與任何人的芯片無關(guān)——英偉達(dá)是一家計(jì)算平臺(tái)公司,必須發(fā)展我們自己的開發(fā)者——這就是GTC存在的原因。”“如果我們是x86公司,為什么還要辦開發(fā)者大會(huì)?”黃仁勛犀利發(fā)問,“開發(fā)者大會(huì)是干什么的?因?yàn)榧軜?gòu)仍在被接受,它的使用是復(fù)雜的,我們還沒克服,所以DRAM不需要開發(fā)者大會(huì),互聯(lián)網(wǎng)不需要開發(fā)者大會(huì),但向我們這樣的計(jì)算平臺(tái)需要,因?yàn)槲覀冃枰_發(fā)者,這些開發(fā)者會(huì)感激英偉達(dá)在每個(gè)云上都無處不在。”
02.解釋Blackwell定價(jià):沒想賣GPU,數(shù)據(jù)中心才是追求
Raymond James分析師估計(jì)英偉達(dá)制造每個(gè)H100成本約為3320美元,B200成本約為6000美元,GB200解決方案成本遠(yuǎn)高于80GB內(nèi)存的單芯片GH100;一個(gè)H100售價(jià)2.5萬(wàn)~3萬(wàn)美元,新GPU價(jià)格將比H100高出50%~60%。不過英偉達(dá)并未公開其定價(jià),這也是英偉達(dá)少見地沒在官網(wǎng)直接列出B200的詳情頁(yè),僅僅放出DGX B200和DGX B200 SuperPOD的介紹信息,Blackwell架構(gòu)介紹頁(yè)面也還沒有上線。
▲英偉達(dá)官網(wǎng)目錄截圖拼接(綠色部分為本屆GTC大會(huì)發(fā)布新品)
這周在接受CNBC專訪時(shí),黃仁勛透露新GPU架構(gòu)的研發(fā)預(yù)算大概是100億美元,Blackwell GPU的售價(jià)約為3萬(wàn)~4萬(wàn)美元。對(duì)于這一問題,黃仁勛在今日的媒體溝通會(huì)上做了補(bǔ)充說明:
6、Blackwell定價(jià)范圍是多少?你之前提到每個(gè)Blackwell GPU價(jià)格是3萬(wàn)-4萬(wàn)美元。還有TAM,你想在2500億美元TAM中占多大比例?
黃仁勛回復(fù)說:“我只是想讓大家對(duì)我們產(chǎn)品的定價(jià)有大概的了解,并不打算報(bào)價(jià)——我們賣得不是芯片,而是系統(tǒng)。”據(jù)他解釋,Blackwell對(duì)不同系統(tǒng)的定價(jià)不同,不僅是Blackwell,系統(tǒng)還包括NVLink,分區(qū)是不同的,英偉達(dá)會(huì)給每個(gè)產(chǎn)品定價(jià),定價(jià)將一如既往來自TCO?!?strong>英偉達(dá)并不制造芯片,英偉達(dá)構(gòu)建數(shù)據(jù)中心。”黃仁勛強(qiáng)調(diào)道。英偉達(dá)構(gòu)建了全棧系統(tǒng)和所有軟件,通過調(diào)試,使它具有高性能,構(gòu)建數(shù)據(jù)中心。英偉達(dá)把數(shù)據(jù)中心分解成很多個(gè)模塊,這樣客戶就能根據(jù)需求選擇如何配置,自行決定買多少、怎么買。一個(gè)原因是,也許你的網(wǎng)絡(luò)、存儲(chǔ)、控制平臺(tái)、安全性、管理是不同的,所以英偉達(dá)和你一起分解所有的東西,幫你探索如何把它們整合到你的系統(tǒng)中,并有專門團(tuán)隊(duì)來提供幫助。因此這不是買芯片,不是人們過去賣芯片的方式,是關(guān)于設(shè)計(jì)和集成數(shù)據(jù)中心的,英偉達(dá)的商業(yè)模式反映了這一點(diǎn)。至于英偉達(dá)想在2500億美元TAM中占多大比例?黃仁勛說,英偉達(dá)的機(jī)會(huì)不是GPU的機(jī)會(huì),而是芯片的機(jī)會(huì)。GPU市場(chǎng)與英偉達(dá)所追求的市場(chǎng)截然不同,英偉達(dá)正在追求數(shù)據(jù)中心。全球數(shù)據(jù)中心大約是2000億歐元,這是其中的一個(gè)建筑。英偉達(dá)的機(jī)會(huì)是這2500億美元的一部分,現(xiàn)在將會(huì)增長(zhǎng),AI被證明是相當(dāng)成功的,去年是2500億美元,符合增長(zhǎng)率為20-25%,長(zhǎng)期機(jī)會(huì)將會(huì)是1萬(wàn)億~2萬(wàn)億美元,取決于時(shí)間表。
7、在構(gòu)建像Blackwell這樣的平臺(tái)時(shí),你是如何估計(jì)(客戶)的計(jì)算需求的?目標(biāo)基本上是增加計(jì)算,你如何考慮電力、效率和可持續(xù)性?
“我們必須弄清楚物理極限,達(dá)到極限,并要超越極限?!秉S仁勛說,如何超越,是讓事情變得更節(jié)能,例如,你可以用1/4的功率訓(xùn)練GPT。Hopper需要用8000個(gè)GPU的任務(wù),Blackwell只需2000個(gè)GPU,相同時(shí)間只消耗更少能效。因?yàn)槟苄Ц撸梢蕴魬?zhàn)極限。能源效率和成本效率是首要任務(wù)。英偉達(dá)把從大語(yǔ)言模型生成tokens提速30倍,以此節(jié)省很多能源,即生產(chǎn)相同tokens所需的能源減少到原來的1/30。
8、除了HBM之外,怎么看待三星和SK海力士的生產(chǎn)?
黃仁勛調(diào)侃說:“這就像問臺(tái)積電,除了代工,除了GPU,你還喜歡英偉達(dá)嗎?”據(jù)他分享,HBM是復(fù)雜的,附加值很高。英偉達(dá)在HBM上花了很多錢!“我們正在測(cè)試三星HBM,我們將使用它。”黃仁勛透露道,“三星是一個(gè)很好的合作伙伴。韓國(guó)是世界先進(jìn)存儲(chǔ)器生產(chǎn)量最多的國(guó)家。HBM非常復(fù)雜,它不像DDR5。這是一個(gè)科技奇跡。這就是它這么快的原因。HBM就像邏輯,而且越來越復(fù)雜,越來越半定制化。”他稱贊HBM是一個(gè)奇跡,由于生成式AI,整個(gè)數(shù)據(jù)中心的DDR已經(jīng)成為過去,未來屬于HBM?!叭呛蚐K海力士的升級(jí)周期令人難以置信。我們的合作伙伴將與我們一起成長(zhǎng)。我們將用HBM替換數(shù)據(jù)中心中的DDR。能效提高了很多。”黃仁勛說,這就是英偉達(dá)讓世界更可持續(xù)發(fā)展的方式——更先進(jìn)的內(nèi)存,更低的功耗。
9、英偉達(dá)AI代工廠與企業(yè)合作的整體戰(zhàn)略和長(zhǎng)期目標(biāo)是什么?
黃仁勛說,代工廠的目標(biāo)是制造軟件,不是作為工具的軟件,但別忘了,英偉達(dá)一直是一家軟件公司。英偉達(dá)很久以前創(chuàng)建了兩個(gè)重要軟件,一個(gè)叫OptiX,后來變成了RTX;另一個(gè)叫cuDNN,是一個(gè)AI庫(kù),我們有很多不同的庫(kù)。未來的庫(kù)是一種微服務(wù),不僅是用數(shù)學(xué)來描述,在AI中也有描述。這些庫(kù),英偉達(dá)叫cuFFT、cuBLAS、cuLitho——未來它們將是NIM。這些NIM是一些超級(jí)復(fù)雜的軟件,英偉達(dá)將其打包,所以你能訪問網(wǎng)站來使用它,或下載它,在云上或者計(jì)算機(jī)、工作站上運(yùn)行它。英偉達(dá)將使得NIM性能更好。當(dāng)企業(yè)運(yùn)行這些庫(kù)時(shí),自定義操作系統(tǒng)會(huì)進(jìn)行授權(quán),授權(quán)費(fèi)用為4500美元/GPU/年,你可以在上面運(yùn)行任意多的模型。
03.AI芯片競(jìng)爭(zhēng)對(duì)手公開挑釁,???黃仁勛回?fù)簟罢娴牟涣私狻?/strong>
10、你對(duì)Groq這樣的芯片創(chuàng)企有何評(píng)論,Groq昨天發(fā)了一條推文,說要比你的“孩子”更快?
“我真的不太了解,無法做出明智的評(píng)價(jià)?!秉S仁勛認(rèn)為token生成很難,取決于你想要的模型,每個(gè)模型都需要自己特殊的分區(qū)方式。在他看來,成為Transformer并不是所有模型的終結(jié)——每個(gè)Transformer都是相關(guān)的,因?yàn)槎加凶⒁饬?;但它們又都是完全不同,有些是前饋或MoE(混合專家),有些MoE是2個(gè)專家,有些是4個(gè),分工方式都是不同的,所以這些模型中的每一個(gè)都需要非常特殊的優(yōu)化。如果計(jì)算機(jī)太脆弱,被設(shè)計(jì)來做一些非常具體的事情,它就變成了一臺(tái)可配置的計(jì)算機(jī),而不是可編程的計(jì)算機(jī)。它不會(huì)讓你從軟件創(chuàng)新的速度中獲益。黃仁勛認(rèn)為,不能低估CPU奇跡的原因——由于可編程,CPU隨著時(shí)間推移已經(jīng)克服了主板上、PC上這些可配置的東西。軟件工程師的天才可以通過CPU來實(shí)現(xiàn),如果把它固定到芯片中,那就切斷了軟件用戶的芯片才華。它真正要做的是從兩者中獲益。他說,英偉達(dá)已經(jīng)找到了一種特殊的計(jì)算形式,采用并行流計(jì)算模型,具有容錯(cuò)性,性能非常好,并且可編程。有一個(gè)架構(gòu)從AlexNet開始就存在了,貫穿了所有的模型,最終Transformer出現(xiàn)了,有一大堆變種,這些模型在狀態(tài)空間、內(nèi)存和體系結(jié)構(gòu)中不斷發(fā)展。“我們能做出一個(gè)有水平的模型是很重要的。”黃仁勛說,“芯片的存在是用來實(shí)現(xiàn)軟件的。我們的工作是促進(jìn)下一個(gè)ChatGPT的發(fā)明。如果是Llama-7B,我會(huì)感到非常驚訝和震驚?!?/p>
04.怎么看OpenAI CEO的芯片工廠網(wǎng)絡(luò)計(jì)劃?
11、Sam Altman一直在和整個(gè)芯片產(chǎn)業(yè)的人充分談擴(kuò)大范圍和規(guī)模。你跟他聊過嗎?你怎么看他想做什么?這對(duì)你和英偉達(dá)有什么影響?
“我不知道他的意圖,除非他認(rèn)為生成式AI是一個(gè)巨大的市場(chǎng)機(jī)會(huì),我同意。”黃仁勛說。他從基本原理談起,今天計(jì)算機(jī)生成像素、檢索、解壓縮、顯示。人們認(rèn)為整個(gè)過程只需要很少的能量,但事實(shí)恰恰相反。原因是每個(gè)提示詞、每件事、每次你用手機(jī),它都要傳到某個(gè)地方的數(shù)據(jù)中心,以一種從推薦系統(tǒng)的角度來看有意義的方式獲得一些響應(yīng),然后把它發(fā)回給你。例如,假如每次問他一個(gè)問題,他都要跑到自己的辦公室,而不是直接回答,這就很浪費(fèi)時(shí)間和精力。他認(rèn)為一起工作的方式應(yīng)該是擴(kuò)大AI生成。未來越來越多的計(jì)算將是生成的,而不是檢索,一代代必須是聰明的,并且上下文相關(guān)。“我相信,我想Sam也相信,幾乎每個(gè)計(jì)算機(jī)上的每個(gè)像素,每次你與計(jì)算機(jī)交互時(shí),都由一個(gè)生成式芯片生成?!彼M鸅lackwell和后續(xù)迭代能繼續(xù)在這個(gè)領(lǐng)域做出很大貢獻(xiàn)?!叭绻總€(gè)人的計(jì)算機(jī)體驗(yàn)都是生成式的,我不會(huì)感到驚訝。但今天還不是這樣。這是個(gè)很大的機(jī)會(huì),我想我會(huì)同意這個(gè)問題?!秉S仁勛說。
05.AI替寫代碼,人類不用學(xué)編程了?
12、你之前說過沒人需要學(xué)編程了,是在暗示人們不應(yīng)該學(xué)習(xí)編程技能嗎?
黃仁勛認(rèn)為人們?cè)趯W(xué)很多技能,像鋼琴、小提琴這樣的技能真的很難,并認(rèn)為無論是數(shù)學(xué)、代數(shù)、微積分還是微分方程,人們應(yīng)該盡可能多地學(xué)習(xí)這些技能。但對(duì)于成功者來說,編程技能并不是必不可少的。“曾經(jīng)有段時(shí)間,全世界很多大佬都在提倡,每個(gè)人都必須學(xué)習(xí)編程,因此你效率低。”他分享說,“但我認(rèn)為這是錯(cuò)誤的,學(xué)C++不是一個(gè)人的工作,這是計(jì)算機(jī)的工作來讓C++起作用。”在他看來,AI已經(jīng)對(duì)社會(huì)做出了最大的貢獻(xiàn)——你不必是一個(gè)C++工程師才能成功,只要做一個(gè)及時(shí)的工程師。例如,人類通過對(duì)話進(jìn)行交流,我們需要學(xué)習(xí)如何提示AI,就像在運(yùn)動(dòng)中提示隊(duì)友獲得你想要的結(jié)果一樣,這取決于你想要做的工作、想要取得的高質(zhì)量結(jié)果、是否尋找更多想象力,或者是否想在結(jié)果中更具體。根據(jù)不同的答案、不同的人,你會(huì)給出不同的提示?!?strong>我相信AI所做的第一件偉大的事,是縮小技術(shù)鴻溝。看看YouTube上所有的視頻,都是人們創(chuàng)建AI,而不是編寫任何程序,所以我認(rèn)為這很有趣?!秉S仁勛說,“但如果有人想學(xué)習(xí)編程——請(qǐng)這樣做。我們正在招聘程序員!”
06.給AGI設(shè)定時(shí)間表,是否害怕AGI?
13、你之前提到AGI將在5年內(nèi)實(shí)現(xiàn),這個(gè)時(shí)間表還在嗎?你害怕AGI嗎?
黃仁勛略帶回懟地回答道:“首先,定義AGI?!彼聊艘粫?huì)兒,接著說道:“我停頓了一下,是因?yàn)楝F(xiàn)在,正如我所說的,我確信每個(gè)人都很難做到這一點(diǎn)。我想讓你具體定義一下AGI,這樣我們每個(gè)人都知道我們什么時(shí)候能到達(dá)?!彼苯颖磉_(dá)出對(duì)此前新聞報(bào)道斷章取義做法的不滿:“每次回答這個(gè)問題,我都會(huì)指定AGI規(guī)范。但每次報(bào)道時(shí),都沒有人具體說明。所以這取決于你的目標(biāo)是什么。我的目標(biāo)是和你交流。你的目標(biāo)是弄清楚你想講什么故事?!薄癘K,所以我相信AGI,正如我所指出的,可能在5年內(nèi),AGI,也就是通用智能,我不知道我們是如何互相定義對(duì)方的,這就是為什么我們有這么多不同的詞來形容彼此的智力。”他談道。在黃仁勛看來,預(yù)測(cè)我們何時(shí)會(huì)看到一個(gè)通用的AGI,取決于如何定義AGI,需要明確AGI在問題中的具體含義。他舉了兩個(gè)例子,比如定義圣克拉拉在哪里,它的位置很具體;再比如定義新年,盡管所處時(shí)區(qū)不同,每個(gè)人都知道新年什么時(shí)候到來。但AGI有些不同。黃仁勛說,如果我們將AGI指定為具體特定的東西,比如一個(gè)軟件程序做完一組測(cè)試成績(jī)可以達(dá)到優(yōu)秀(80%以上),比大多數(shù)人甚至比所有人都好,你認(rèn)為計(jì)算機(jī)能在5年內(nèi)做到這一點(diǎn)嗎?答案可能是肯定的。這些測(cè)試可以是數(shù)學(xué)、閱讀、邏輯、學(xué)術(shù)、經(jīng)濟(jì)測(cè)試以及律師資格、醫(yī)學(xué)預(yù)科考試等。
14、未來我們的生活如何隨著大語(yǔ)言模型和基礎(chǔ)模型而改變?黃仁勛認(rèn)為,問題是我們?nèi)绾螕碛凶约旱拇笳Z(yǔ)言模型。“有幾個(gè)方法可以做到,一開始,我們認(rèn)為你不斷微調(diào),但微調(diào)很耗時(shí),然后我們發(fā)現(xiàn)了提示調(diào)優(yōu),發(fā)現(xiàn)了長(zhǎng)上下文窗口、工作記憶。我認(rèn)為答案是所有這些因素的結(jié)合?!彼劦?。在他看來,未來你只用調(diào)整一層權(quán)重就能微調(diào)。你不需要調(diào)整所有的,只需像LoRA一樣微調(diào)一層。低成本微調(diào)、提示工程、上下文、記憶存儲(chǔ),所有這些一起構(gòu)成你的定制大語(yǔ)言模型。它可以在某個(gè)云服務(wù)里,也可以在你自己的電腦。
15、軟件最大的增長(zhǎng)機(jī)會(huì)在哪兒?是微服務(wù)嗎?黃仁勛說,英偉達(dá)最近的機(jī)會(huì)是兩種類型的數(shù)據(jù)中心計(jì)算,一個(gè)是關(guān)于數(shù)據(jù)中心的現(xiàn)代化計(jì)算,另一個(gè)是數(shù)據(jù)中心的新提示生成。英偉達(dá)這樣做是想幫助客戶制造AI。Llama、Mixtral、Grok……很多團(tuán)隊(duì)創(chuàng)造了AI,但這些AI很難使用?;A(chǔ)模型是原始的,不好用。英偉達(dá)將創(chuàng)建其中的一些,然后選擇一些主流的開源合作伙伴,并將這些模型轉(zhuǎn)化為產(chǎn)品質(zhì)量的可用模型。它還需提供服務(wù),比如NeMo?!拔覀儾恢粫?huì)發(fā)明AI,還要制造AI軟件,這樣每個(gè)人都能使用它們。我們的軟件大約是10億美元運(yùn)行率,我認(rèn)為制造AI肯定能做相當(dāng)多的事?!秉S仁勛說。
16、一些關(guān)鍵任務(wù)要求100%正確,AI幻覺問題可以得到解決嗎?黃仁勛認(rèn)為,幻覺是可以解決的,只要確保答案得到充分研究。他談道,添加一條規(guī)則,對(duì)于每個(gè)答案,你都必須查找答案,這就是RAG檢索增強(qiáng)生成。如果你做一個(gè)查詢,它應(yīng)該先做搜索,不會(huì)編造一個(gè)答案并輸出,而是優(yōu)先考慮最準(zhǔn)確地回答內(nèi)容,然后反饋給用戶。這個(gè)AI如果很重要,它不只是回答你,會(huì)先做研究,確定哪個(gè)答案是最好的,然后總結(jié)。這不是幻覺,是一個(gè)研究助理。這也取決于臨界情況——更多的護(hù)欄或及時(shí)的工程。對(duì)于關(guān)鍵任務(wù)的答案,例如健康建議或類似問題,黃仁勛認(rèn)為,可能檢查核對(duì)多種資源和已知的事實(shí)來源才是前進(jìn)的方向。
17、你談到用生成式AI和模擬來大規(guī)模訓(xùn)練機(jī)器人,但很多東西不好模擬,尤其當(dāng)機(jī)器人走出建筑環(huán)境時(shí),你認(rèn)為模擬會(huì)有什么限制?當(dāng)我們碰到這些限制時(shí)應(yīng)該怎么做?黃仁勛說,有幾種不同的方式來思考這個(gè)問題。首先是構(gòu)建你對(duì)大語(yǔ)言模型的想法。請(qǐng)記住,大語(yǔ)言模型是在一個(gè)不受約束的、非結(jié)構(gòu)化的世界中運(yùn)行的。這可能是個(gè)問題,但它從中吸取了很多教訓(xùn)。大語(yǔ)言模型的泛化能力是神奇的,然后通過迭代或通過提示來獲取上下文窗口。例如你要在廚房里做煎蛋卷,只有你才能具體說明問題,指定背景、你能用的工具,描述機(jī)器人的環(huán)境,這個(gè)機(jī)器人應(yīng)該能夠有效地泛化。這是機(jī)器人的ChatGPT時(shí)刻。仍有一些問題需要解決,但可以看到推斷。這一切都可以產(chǎn)生token,這些token在機(jī)器人看起來像這樣前就已經(jīng)生成了。機(jī)器人學(xué)對(duì)軟件是有意義的。軟件不懂其中的區(qū)別,只是個(gè)token。所以你必須組織所有的姿勢(shì),將所有輸出標(biāo)注化,概括環(huán)境,輸入上下文,加強(qiáng)人類反饋,給它一大堆適當(dāng)?shù)膯柎鹄樱谡軐W(xué)、化學(xué)、數(shù)學(xué)中的適當(dāng)答案。其中一些在頁(yè)面中進(jìn)行了描述。你可能需要1萬(wàn)多個(gè)大模型示例才能做出ChatGPT。我們的大腦可以區(qū)分文字和機(jī)器人動(dòng)作之間的區(qū)別,計(jì)算機(jī)只能看到數(shù)字,它不知道這些東西的區(qū)別。
18、關(guān)于電腦游戲,去年你說每個(gè)像素都會(huì)被生成、渲染,你認(rèn)為我們離這個(gè)每個(gè)像素都以實(shí)時(shí)幀速率生成的世界還有多遠(yuǎn)?你對(duì)游戲/非游戲的愿景是什么?黃仁勛認(rèn)為幾乎所有的技術(shù),S曲線都不會(huì)比技術(shù)長(zhǎng)。一旦它變得實(shí)用和更好,就像ChatGPT一樣,我想用不了10年的時(shí)間。在10年時(shí)間里,你是另一種專家;5年后,事情在實(shí)時(shí)變化,一切正在發(fā)生。所以你只需要決定我們?cè)谶@方面走了多遠(yuǎn)?,F(xiàn)在大概是2年了。在接下來的5-10年里,情況基本上就是這樣。
19、您曾說過很多行業(yè)都將迎來ChatGPT時(shí)刻,能挑個(gè)令你興奮的講講嗎?黃仁勛說,有些讓他興奮的是技術(shù)原因,有些是因?yàn)榈谝淮谓佑|,有些是因?yàn)橛绊憽!?strong>我對(duì)Sora非常興奮,OpenAI做的很棒,去年我們?cè)?a class="article-link" target="_blank" href="/tag/%E8%87%AA%E5%8A%A8%E9%A9%BE%E9%A9%B6/">自動(dòng)駕駛公司W(wǎng)ayve上看到了同樣的情況,你也看到了我們所做的一些例子,差不多兩年前,關(guān)于從作品中生成視頻?!彼劦?。為了生成視頻,模型必須了解物理,所以當(dāng)你把杯子放下時(shí),杯子是在桌子上,而不是在桌子的中間。它有感受力。它不必遵守物理定律,但它必須是明智的,理解所有的物理定律。其次,黃仁勛認(rèn)為英偉達(dá)對(duì)Earth-2氣候數(shù)字孿生云平臺(tái)的生成式AI模型CoreDiff所做的工作對(duì)預(yù)測(cè)2-3公里范圍內(nèi)的天氣有巨大影響。英偉達(dá)使其能效提高了3000倍,同時(shí)速度提高了1000倍,可以預(yù)測(cè)極端天氣下的飛行路線,在混亂天氣的情況下,可以更頻繁地采樣,采樣1萬(wàn)次。這個(gè)例子得到最可能答案的能力有很大提升。第三,在分子生成、藥物發(fā)現(xiàn)方面所做的工作,在具有目標(biāo)蛋白質(zhì)非常理想的特性的可藥物分子中??梢园阉旁谙馎lphaGo這樣的強(qiáng)化學(xué)習(xí)循環(huán)中,生成各種分子與蛋白質(zhì)的連接,進(jìn)而探索巨大的空間。這是非常令人興奮的。
20、請(qǐng)深入談?wù)勀銓?duì)藥物發(fā)現(xiàn)、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)和分子設(shè)計(jì)的看法,這對(duì)其他領(lǐng)域有何影響?
黃仁勛說:“我們可能是最大的不制造量子計(jì)算機(jī)的量子計(jì)算公司。我們這樣做的原因是因?yàn)槲覀兿嘈潘?,我們想在這里,我們只是認(rèn)為沒有必要再建立一個(gè)?!盦PU是一個(gè)加速器,就像GPU一樣,用于一些非常特定的事情。英偉達(dá)打造了cuQuantum,來模擬量子計(jì)算機(jī)??梢杂?4-36個(gè)量子比特。人們用它來模擬量子電路。我們可以做后量子加密,讓世界為量子做好準(zhǔn)備,因?yàn)楫?dāng)量子到來時(shí),所有數(shù)據(jù)都被正確地編碼、加密。英偉達(dá)可以為所有人做出貢獻(xiàn),與世界上大多數(shù)量子計(jì)算公司合作。黃仁勛相信還需要一段時(shí)間才能帶來突破。對(duì)于數(shù)字生物學(xué)來說,NIM的敏感性來源于數(shù)字生物學(xué)。BioNeMo是英偉達(dá)的第一個(gè)NIM。這些模型太復(fù)雜了,所以英偉達(dá)想用一種特殊的方式來封裝它們,以便所有研究人員都能使用。BioNeMo在很多地方都得到了應(yīng)用。輸入一對(duì)化學(xué)蛋白,它會(huì)告訴你結(jié)合能是否有效;或者發(fā)送一種化學(xué)物質(zhì),并要求它產(chǎn)生其他化學(xué)物質(zhì)。
附:黃仁勛15分鐘演講干貨信息實(shí)錄
現(xiàn)場(chǎng)媒體溝通會(huì)分為兩部分。在進(jìn)行媒體問答前,黃仁勛先做了15分鐘的單人演講。期間,黃仁勛特別提到對(duì)OpenAI視頻生成模型Sora的看法,并從對(duì)生成式AI趨勢(shì)、AI編程的見解,聊到英偉達(dá)重點(diǎn)產(chǎn)品線的技術(shù)規(guī)劃和布局邏輯,包括新架構(gòu)Blackwell的革命性進(jìn)展、Omniverse API、系統(tǒng)模塊化設(shè)計(jì)等。
以下是黃仁勛15分鐘演講精編:行業(yè)正同時(shí)經(jīng)歷兩個(gè)轉(zhuǎn)型:一是從通用計(jì)算到加速計(jì)算;二是生成式AI新工具出現(xiàn)。生成式AI被一些人稱作數(shù)據(jù)中心。一個(gè)標(biāo)準(zhǔn)數(shù)據(jù)中心有文件,而生成式AI產(chǎn)生token,它生成的浮點(diǎn)數(shù)會(huì)變成文字、圖像、聲音。未來,這些token將是蛋白質(zhì)、化學(xué)物質(zhì)、動(dòng)畫機(jī)器、機(jī)器人。如果計(jì)算機(jī)能說話,為什么它不能像機(jī)器人一樣移動(dòng)呢?生成器是一個(gè)新的類別、新的行業(yè),這就是為什么說新工業(yè)革命正在發(fā)生。這些房間、建筑被稱作AI工廠。上一次工業(yè)革命,投入水和燃料,產(chǎn)生電?,F(xiàn)在進(jìn)入AI工廠的是數(shù)據(jù),輸出的是token,token可以分布到全世界,納入公司成本、運(yùn)營(yíng)費(fèi)用、資本支出。在新世界,軟件非常復(fù)雜,越來越大,需要很多不同的東西。今天它通過文字、圖像、視頻、強(qiáng)化學(xué)習(xí)、合成數(shù)據(jù),通過像AlphaGo一樣的辯論來學(xué)習(xí)。隨著時(shí)間推移,這些模型會(huì)變得越來越復(fù)雜,它會(huì)學(xué)習(xí)很多方法。黃仁勛著重分享了3個(gè)突破:
1、節(jié)能省錢:英偉達(dá)為萬(wàn)億參數(shù)的未來創(chuàng)造了全新一代計(jì)算,由Blackwell實(shí)現(xiàn)。Blackwell非常高效節(jié)能。以訓(xùn)練GPT-MoE-1.8T參數(shù)模型為例,H100是90天15MW電力,而Blackwell是4MW,節(jié)省了11MW?!拔覀兘档土诉@項(xiàng)工作量?!秉S仁勛說這節(jié)省了很多很多的能源、很多很多的錢
2、AI生成:游戲玩家總將GPU看作一個(gè)生成式引擎,生成圖像和像素。你看到的所有圖像都是由最大的GPU生成的。未來,圖像、視頻、文本、蛋白質(zhì)、分子都將由GPU生成。GPU從圖形生成發(fā)展到AI訓(xùn)練、AI推理,現(xiàn)在是AI生成。我們幾乎所有的計(jì)算經(jīng)驗(yàn)都將在大量產(chǎn)生,一切都將被預(yù)記錄、個(gè)性化生成。未來一切都將被創(chuàng)造出來,而這需要一個(gè)特殊的處理器。英偉達(dá)打造了Blackwell,有第二代Tranformer引擎、下一代NVLink、多GPU并行。
3、軟件:未來,軟件是AI,你只要跟它說話,就能進(jìn)行互動(dòng),非常易用。API如此自然,可以將很多AI連接在一起。英偉達(dá)打造了NIM微服務(wù),把它們連在一起,讓公司可以用現(xiàn)成的、定制的。NeMo服務(wù)可幫助客戶定制NIM,這被稱作AI代工廠。英偉達(dá)擁有實(shí)現(xiàn)該目標(biāo)的技術(shù)、專業(yè)知識(shí)、基礎(chǔ)設(shè)施,這就是代工廠,英偉達(dá)可幫助每個(gè)公司來構(gòu)建定制AI,把AI技術(shù)推向世界。
在黃仁勛看來,對(duì)于下一波AI浪潮,AI必須理解物理世界。“我們從OpenAI看到了一些革命性的、令人驚嘆的AI,叫作Sora。當(dāng)Sora生成的視頻是有意義的,汽車停在路上轉(zhuǎn)彎,一個(gè)沉思的人走在街上有倒影,顯然AI理解這一點(diǎn),理解物理定律?!彼忉屨f,“如果我們把它發(fā)揮到極限,那么AI就能在物理世界中行動(dòng),這就是機(jī)器人技術(shù)?!币虼?,下一代需要新的計(jì)算機(jī)來運(yùn)行新的機(jī)器人、新的工具Omniverse、數(shù)字孿生,必須開發(fā)新的基礎(chǔ)模型。英偉達(dá)以技術(shù)平臺(tái)而非工具制造商的身份進(jìn)入市場(chǎng)。企業(yè)可使用Omniverse API來創(chuàng)建數(shù)字孿生。黃仁勛對(duì)于該任務(wù)的成功感到非常高興,稱連接到這些工具是“超級(jí)充電”。Blackwell是芯片的名字,也是計(jì)算機(jī)系統(tǒng)的名字。英偉達(dá)有一個(gè)沿用之前版本的x86系統(tǒng),叫HGX,你可以把Hopper的托盤拉出來,然后把Blackwell推進(jìn)去。由于支持生產(chǎn)的基礎(chǔ)設(shè)施已經(jīng)存在,生產(chǎn)轉(zhuǎn)換和客戶增長(zhǎng)將變得容易得多。英偉達(dá)也有DGX,液冷新架構(gòu),可以創(chuàng)建大型NVLink域,支持在一個(gè)域中采用8個(gè)GPU,即16個(gè)die。如果想打造更大的機(jī)器,英偉達(dá)有Blackwell和Grace Blackwell超級(jí)芯片的堆疊版本,以及NVLink Switch。黃仁勛說,NVLink Switch是“世界上性能最高的交換機(jī)”,是非常模塊化的,很受歡迎。