9月5日,香港科技大學(xué)校董會(huì)主席、美國國家工程院外籍院士沈向洋在2024 Inclusion·外灘大會(huì)上分享了他對大模型產(chǎn)業(yè)落地的八個(gè)思考。他認(rèn)為,AI Agent時(shí)代的到來,不會(huì)是一個(gè)神奇而強(qiáng)大的模型突然代替了所有工作流,它涉及技術(shù)、工程與市場的不斷磨合,最終以超預(yù)期的服務(wù)呈現(xiàn)給人類。
思考一:算力是門檻
“今天做大模型,做深度學(xué)習(xí),首先最重要的事情是要有算力?!鄙蛳蜓蟊硎?。他指出,從2010年開始,大模型需要的算力以6、7倍的速度增長。這幾年穩(wěn)定下來,大概每年有4倍的增長。模型越來越大,參數(shù)量越來越大,算力的需求也隨著參數(shù)的增長,呈現(xiàn)出平方向的增長。在他看來,整個(gè)計(jì)算機(jī)芯片行業(yè)的發(fā)展已經(jīng)從原來的“摩爾定律”變成了“黃氏定律”。以前摩爾定律認(rèn)為,算力每隔18個(gè)月增長一倍。如今預(yù)測,GPU將推動(dòng)AI算力實(shí)現(xiàn)逐年翻倍?!爸v卡傷感情,沒卡沒感情。以前有一句話叫貧窮限制想象力,現(xiàn)在貧窮可能扭曲想象力,因?yàn)槿绻麤]有卡,能想象要做的項(xiàng)目可能就不太一樣了?!鄙蛳蜓蟾锌?
思考二:關(guān)于數(shù)據(jù)的數(shù)據(jù)
公開資料顯示,GPT3的訓(xùn)練數(shù)據(jù)達(dá)到了2個(gè)T的token(吞吐量),GPT4則達(dá)到了12個(gè)T左右。據(jù)沈向洋預(yù)判,GPT5的訓(xùn)練數(shù)據(jù)可能會(huì)達(dá)到200個(gè)T。目前互聯(lián)網(wǎng)上的數(shù)據(jù)遠(yuǎn)遠(yuǎn)不能滿足未來模型訓(xùn)練的需求,還需要思考用什么辦法去挖掘更多的數(shù)據(jù)。在人工智能領(lǐng)域,數(shù)據(jù)被視為模型的“燃料”,模型需要從這些數(shù)據(jù)中學(xué)習(xí)和提取有用信息。因此,數(shù)據(jù)的數(shù)量、質(zhì)量和多樣性都會(huì)直接影響到模型的準(zhǔn)確性和性能。沈向洋表示,之前作為互聯(lián)網(wǎng)最核心的積累,數(shù)據(jù)大多被谷歌用來做搜索引擎,以后這些數(shù)據(jù)都會(huì)被拿來訓(xùn)練大模型?!盎ヂ?lián)網(wǎng)40年積累的數(shù)據(jù),好像就是為了這樣一個(gè)AI時(shí)刻”。
思考三:大模型的下一章
下一步到底要干什么?沈向洋認(rèn)為,大模型產(chǎn)業(yè)未來的發(fā)展路徑已經(jīng)非常明確,將會(huì)從之前的大語言模型,到多模態(tài)模型,未來邁向世界模型。從技術(shù)上講,肯定要走理解和生成統(tǒng)一起來的道路。“未來一定會(huì)往具身智能方向上走,往機(jī)器人上面走,其中一個(gè)特殊形態(tài)就是自動(dòng)駕駛?!鄙蛳蜓笳f道。實(shí)際上,關(guān)于世界模型業(yè)內(nèi)并沒有形成一個(gè)標(biāo)準(zhǔn)的定義。OpenAI推出的Sora模型曾引發(fā)業(yè)內(nèi)對“世界模型”的探討。OpenAI將其視為能夠理解和模擬現(xiàn)實(shí)世界的模型的基礎(chǔ),相信其能力是實(shí)現(xiàn)AGI(通用人工智能)的重要里程碑。然而,沈向洋認(rèn)為,“Sora模型雖然做的非常好了,但還不是那么強(qiáng)大,里面的物理性質(zhì)是不能保證的,做不到一個(gè)世界模型?!?/p>
思考四:大模型橫掃千行百業(yè)
大模型可分為通用大模型、行業(yè)大模型、企業(yè)大模型和個(gè)人大模型。沈向洋指出,通用大模型是AI的基礎(chǔ),要訓(xùn)練一個(gè)通用大模型至少需要萬卡;行業(yè)大模型是做領(lǐng)域應(yīng)用的底座,需要千卡級(jí)別的訓(xùn)練;企業(yè)大模型是企業(yè)數(shù)據(jù)價(jià)值的再發(fā)現(xiàn),需要百卡級(jí)別的訓(xùn)練。這些大模型都對算力的要求極高?!白罴?dòng)人心的是個(gè)人大模型,比如聯(lián)想、微軟在推AIPC和蘋果的Apple Intelligence等都是朝著個(gè)人智能這個(gè)方向發(fā)展的?!鄙蛳蜓笳f道。截至今年7月底,中國已備案大模型達(dá)到了197個(gè),其中30%是通用大模型,70%是行業(yè)大模型。“可以看到,行業(yè)大模型占到絕大多數(shù),未來肯定還會(huì)越來越多?!鄙蛳蜓蟊硎尽?/p>
思考五:AI Agent——從愿景到落地
2024年5月,微軟公司創(chuàng)始人比爾·蓋茨公開表示,AI Agent不僅會(huì)改變每個(gè)人與計(jì)算機(jī)交互的方式,還將顛覆軟件行業(yè),帶來從鍵入命令到點(diǎn)擊圖標(biāo)以來,最大的計(jì)算革命。沈向洋對此觀點(diǎn)表示認(rèn)同。他認(rèn)為,人工智能時(shí)代,真正了不起的超級(jí)應(yīng)用就是AI Agent。AI Agent從愿景到落地的過程中,需要始終以需求為圓點(diǎn),深刻理解模型的能力,并構(gòu)建一個(gè)AI深度參與的工作流程?!敖裉煸谝患夜纠锕ぷ鞯脑?,整個(gè)工作流是非常復(fù)雜的,ChatGPT雖然很強(qiáng)大,但遠(yuǎn)遠(yuǎn)沒達(dá)到Agent的程度,它只實(shí)現(xiàn)了單點(diǎn)突破,真正要向前走還得融入整個(gè)工作流?!彼f。
思考六:重視AI的治理
AI治理非常重要。今年世界人工智能大會(huì)(WAIC)的主題就是在講AI治理,各個(gè)國家對于這件事情的看法有很多不一樣。AI的發(fā)展,對民眾、公司、政府監(jiān)管、社會(huì)發(fā)展等各個(gè)方面都產(chǎn)生了強(qiáng)大的沖擊,引發(fā)了公眾對于其安全治理的擔(dān)憂?!拔矣X得接下來人工智能的發(fā)展很重要的一點(diǎn),從全球各個(gè)國家角度來講,是一定要做主權(quán)人工智能,而主權(quán)人工智能背后一定需要有一個(gè)主權(quán)云來支持主權(quán)人工智能的發(fā)展?!鄙蛳蜓蟊硎尽?/p>
思考七:重新思考人機(jī)關(guān)系
“GPT帶來的沖擊有多少是人機(jī)交互的震撼,又有多少是機(jī)器智能的發(fā)展?”沈向洋認(rèn)為應(yīng)該重新思考人機(jī)之間的關(guān)系。他指出,AI為人類提供了與技術(shù)共生的全新語境,人機(jī)交互的新方式指向“AI與IA”的融合共進(jìn)。IA(Intelligent Augmentation),即智能增強(qiáng),代表著一種以人為本的 AI 發(fā)展路徑。它聚焦于運(yùn)用技術(shù)提升人類的能力,而非取代人類,強(qiáng)調(diào)了人類與 AI 之間的協(xié)作關(guān)系?!凹~約時(shí)報(bào)專欄作者John Markoff 提到,計(jì)算機(jī)過去幾十年的發(fā)展路程里,真正的贏家是做人機(jī)交互的。不管是什么技術(shù),最后的目的都應(yīng)該是幫助人類更好地使用機(jī)器?!鄙蛳蜓蟊硎?,“到了AI時(shí)代,人機(jī)交互最本質(zhì)的是對話,就像ChatGPT這樣。ChatGPT加上微軟,會(huì)不會(huì)成為AI時(shí)代最偉大的公司?我想只有時(shí)間才能夠驗(yàn)證?!?/p>
思考八:智能的本質(zhì)
今天,GPT的發(fā)展如火如荼,但實(shí)際上,人們對智能的理解還是非常有限的。不同于物理學(xué),上到浩瀚的星空,下到微小的量子,都能有一個(gè)大一統(tǒng)的理論可以解釋;今天的深度學(xué)習(xí)很多東西都是不可解釋的,沒有魯棒性?!爸悄艿谋举|(zhì)是神經(jīng)網(wǎng)絡(luò)與符號(hào)系統(tǒng)的世紀(jì)之爭?!鄙蛳蜓笳f道,“今天,雖然人工智能的發(fā)展還處在一個(gè)相對來講比較早期的階段,但是行業(yè)上已經(jīng)有很多的應(yīng)用,值得下定決心去做,我對未來的發(fā)展充滿信心?!?/p>
作者丨宋婧編輯丨趙晨美編丨馬利亞監(jiān)制丨連曉東