編譯?|??程茜
編輯?|??心緣
數(shù)據(jù)中心、視頻壓縮、更快算法!谷歌DeepMind亮出AGI時(shí)代三大工具。
智東西6月8日消息,6月7日晚,人工智能研究實(shí)驗(yàn)室Google DeepMind發(fā)布三大AI工具AlphaZero、MuZero、AlphaDev,這些工具可以提高數(shù)據(jù)中心資源利用率、提升視頻壓縮效率、發(fā)現(xiàn)更快算法,從而優(yōu)化整個(gè)計(jì)算生態(tài)系統(tǒng)。
昨天,AlphaDev的相關(guān)進(jìn)展已經(jīng)登上國(guó)際學(xué)術(shù)頂刊Nature。AlphaZero的專(zhuān)用版本AlphaDev還發(fā)現(xiàn)了新算法,可以將短元素序列的排序效率提高70%?,F(xiàn)在,AlphaDev的新排序算法已發(fā)布到C++庫(kù)中。Google DeepMind的博客稱(chēng),這是十多年來(lái)排序庫(kù)算法的第一次變化,也是第一次將通過(guò)強(qiáng)化學(xué)習(xí)設(shè)計(jì)的算法添加到該庫(kù)中。散列算法也已經(jīng)發(fā)布到開(kāi)源Abseil庫(kù)中。
C++庫(kù)開(kāi)源鏈接:https://reviews.llvm.org/D118029
論文鏈接:https://www.nature.com/articles/s41586-023-06004-9
Google DeepMind正在努力創(chuàng)建對(duì)世界具有廣泛理解的AI工具來(lái)優(yōu)化計(jì)算生態(tài)系統(tǒng),作為構(gòu)建更加強(qiáng)大和通用人工智能系統(tǒng)的一部分。
研究人員還在擴(kuò)展基于強(qiáng)化學(xué)習(xí)的谷歌AI模型AlphaZero、MuZero的能力,用來(lái)幫助優(yōu)化數(shù)據(jù)中心的視頻壓縮,使得數(shù)據(jù)中心未充分利用的硬件數(shù)量減少19%,以及在不損失視頻質(zhì)量的同時(shí),進(jìn)一步降低比特率。
這些工具目前實(shí)現(xiàn)了整個(gè)計(jì)算生態(tài)系統(tǒng)中效率的提升,但這些結(jié)果也證明了未來(lái)更通用的人工智能工具具有變革的潛力。
01.AlphaDev:排序效率提升70%、檢索效率提升30%,數(shù)百萬(wàn)開(kāi)發(fā)人員已應(yīng)用
此前,Google DeepMind開(kāi)發(fā)了一個(gè)用于玩圍棋游戲的AI系統(tǒng)AlphaZero,現(xiàn)在研究人員將這一系統(tǒng)應(yīng)用到了構(gòu)建算法排序中打造了AlphaDev,其結(jié)果顯示,AlphaDev創(chuàng)建的算法在轉(zhuǎn)換為標(biāo)準(zhǔn)編程語(yǔ)言C++時(shí),排序數(shù)據(jù)的速度是人類(lèi)生成版本的三倍。“我們有點(diǎn)震驚。”領(lǐng)導(dǎo)這項(xiàng)工作的Google DeepMind計(jì)算機(jī)科學(xué)家Daniel Mankowitz說(shuō),“起初我們不相信(這個(gè)結(jié)果)?!?/p>
AlphaDev可以被用于快速排序(faster sorting)和散列算法(hashing algorithms),這兩種算法每天會(huì)被使用數(shù)萬(wàn)億次來(lái)對(duì)數(shù)據(jù)進(jìn)行排序、存儲(chǔ)、檢索。
1、下象棋到找算法,短元素排序效率提高70%
排序算法會(huì)影響所有數(shù)字設(shè)備處理和顯示信息的方式,包括一些在線(xiàn)搜索結(jié)果的呈現(xiàn)、社交媒體上帖子的排名以及一些用戶(hù)推薦內(nèi)容。
AlphaDev研發(fā)了一種可以提升排序效率的算法,并且該算法與C++庫(kù)中人類(lèi)設(shè)計(jì)的算法相比可以將短元素序列的排序效率提高70%,將超過(guò)25萬(wàn)個(gè)元素的序列排序效率提高約1.7%。這也使得當(dāng)用戶(hù)提交搜索查詢(xún)時(shí),AlphaDev的算法可以快速對(duì)結(jié)果進(jìn)行排序,以更快找到與用戶(hù)搜索相關(guān)度高的答案。
剛開(kāi)始,研究人員將AlphaDev應(yīng)用于按大小對(duì)數(shù)字進(jìn)行排序的任務(wù),剛開(kāi)始只是讓其一次對(duì)3、4、5個(gè)數(shù)字進(jìn)行排序,這對(duì)于后續(xù)讓其進(jìn)行較多數(shù)字排序很重要。
▲對(duì)兩個(gè)數(shù)字進(jìn)行排序
AlphaDev的工作方式與AlphaZero類(lèi)似,后者結(jié)合了計(jì)算機(jī)版本的深思熟慮和直覺(jué)來(lái)選擇棋盤(pán)游戲中的動(dòng)作。AlphaDev則不會(huì)選擇動(dòng)作,它會(huì)選擇指令添加到一個(gè)過(guò)程中。AlphaDev通過(guò)從頭開(kāi)始而不是改進(jìn)現(xiàn)有算法來(lái)發(fā)現(xiàn)更快的算法,并且它會(huì)關(guān)注計(jì)算機(jī)的匯編指令。匯編指令用于為計(jì)算機(jī)創(chuàng)建二進(jìn)制代碼以執(zhí)行操作,Google DeepMind的研究人員認(rèn)為,在這個(gè)較低層次上會(huì)有很多可以改進(jìn)的地方。
在構(gòu)建算法時(shí),AlphaDev會(huì)通過(guò)將算法的輸出與預(yù)期結(jié)果進(jìn)行比較來(lái)檢查它是否正確。對(duì)于排序算法,這意味著無(wú)序數(shù)字進(jìn)入,正確排序的數(shù)字出來(lái)。研究人員會(huì)獎(jiǎng)勵(lì)A(yù)lphaDev對(duì)數(shù)字的正確排序以及排序的速度和效率。
2、數(shù)據(jù)存儲(chǔ)節(jié)省近70%時(shí)間,算法已經(jīng)開(kāi)源
Google DeepMind團(tuán)隊(duì)還將AlphaDev應(yīng)用于非排序算法,它用于將特定格式存儲(chǔ)的數(shù)據(jù)轉(zhuǎn)換為字節(jié)的算法版本比標(biāo)準(zhǔn)版本少用了67%的時(shí)間,用于數(shù)據(jù)存儲(chǔ)和檢索的散列算法比標(biāo)準(zhǔn)算法花費(fèi)的時(shí)間少30%。
散列信息算法通常用于在數(shù)據(jù)庫(kù)中進(jìn)行存儲(chǔ)和檢索。散列算法通常使用一個(gè)關(guān)鍵詞來(lái)生成一個(gè)對(duì)應(yīng)的唯一散列,這一散列就會(huì)對(duì)應(yīng)于需要檢索的數(shù)據(jù)值,如輸入關(guān)鍵詞用戶(hù)名“Jane Doe”,會(huì)生成檢索對(duì)應(yīng)的“訂單號(hào)164335-87”。
一個(gè)較為相似的場(chǎng)景是,圖書(shū)管理員通過(guò)分類(lèi)系統(tǒng)來(lái)快速查找特定書(shū)籍,計(jì)算機(jī)借助散列算法,就可以快速理解它要找什么以及在哪里能找到。
▲輸入關(guān)鍵詞檢索對(duì)應(yīng)數(shù)據(jù)值
當(dāng)應(yīng)用于數(shù)據(jù)中心9-16字節(jié)范圍的散列算法時(shí),AlphaDev的算法能將檢索效率提升30%。
去年1月,Google DeepMind的研究人員在LLVM項(xiàng)目的C++標(biāo)準(zhǔn)庫(kù)中發(fā)布了基于機(jī)器學(xué)習(xí)的排序算法,在Abseil庫(kù)發(fā)布了散列算法,目前,已經(jīng)有云計(jì)算、在線(xiàn)購(gòu)物、供應(yīng)鏈管理等行業(yè)的數(shù)百萬(wàn)開(kāi)發(fā)人員和公司正在應(yīng)用這些算法。
02.AlphaZero:優(yōu)化數(shù)據(jù)中心資源硬件充分利用率提高19%
數(shù)據(jù)中心需要管理從提供搜索結(jié)果到處理數(shù)據(jù)集的一切任務(wù)。谷歌大規(guī)模集群管理系統(tǒng)Borg管理著谷歌的數(shù)十億個(gè)任務(wù),同時(shí)這一系統(tǒng)還要去分配工作負(fù)載來(lái)優(yōu)化數(shù)據(jù)中心的內(nèi)部基礎(chǔ)設(shè)施,并處理谷歌搜索等用戶(hù)使用的服務(wù),管理批處理。
分配工作負(fù)載這一過(guò)程就像Borg在玩俄羅斯方塊,如何在有限的空間內(nèi),最大程度地放置更多的方塊,把空余的位置都利用起來(lái)。
▲將分配工作負(fù)載比喻為俄羅斯方塊游戲
此前,Borg需要使用手動(dòng)編碼的規(guī)則來(lái)安排任務(wù),優(yōu)化工作負(fù)載。但面對(duì)龐大如數(shù)十億個(gè)任務(wù)的規(guī)模時(shí),這些手動(dòng)編碼的規(guī)則無(wú)法考慮不斷變化的工作負(fù)載分布的多樣性,因此它們被設(shè)計(jì)為“最適合所有人的一種尺寸”,也就是選擇了一個(gè)中間值。
在這一場(chǎng)景下,AlphaZero就派上了用場(chǎng),其構(gòu)建的算法能夠自動(dòng)創(chuàng)建單獨(dú)的最佳定制規(guī)則,這些規(guī)則使得Borg在分配工作負(fù)載時(shí)更加高效,能找到適合不同任務(wù)的規(guī)則。
研究人員在實(shí)驗(yàn)期間發(fā)現(xiàn),AlphaZero還能識(shí)別進(jìn)入數(shù)據(jù)中心的任務(wù)的模式,以及預(yù)測(cè)管理容量的最佳方法,并做出具有最佳長(zhǎng)期結(jié)果的決策。
當(dāng)AlphaZero應(yīng)用于Borg時(shí),研究人員的實(shí)驗(yàn)表明,這種方法可以將未充分利用的硬件數(shù)量減少多達(dá)19%,優(yōu)化谷歌數(shù)據(jù)中心的資源利用率。
03.MuZero:編碼視頻圖片組壓縮比特率降低4%
在互聯(lián)網(wǎng)中,視頻流會(huì)占據(jù)其流量的相當(dāng)大一部分,因此,如果能提升視頻傳輸?shù)男剩瑢?huì)對(duì)每天觀(guān)看視頻的數(shù)百萬(wàn)人產(chǎn)生巨大影響。
去年,Google DeepMind與視頻網(wǎng)站YouTube合作,通過(guò)MuZero來(lái)壓縮和傳輸視頻,其結(jié)果顯示,這一工具能在不影響視頻質(zhì)量的情況下將比特率降低4%。
早期,研究人員將MuZero應(yīng)用于優(yōu)化視頻中每個(gè)單獨(dú)幀的壓縮,現(xiàn)在,他們將其擴(kuò)展至決定在編碼過(guò)程中如何對(duì)幀進(jìn)行分組和引用。
最開(kāi)始,MuZero會(huì)定義要壓縮的GOP(group of pictures,圖片組)幀,然后根據(jù)圖片的視覺(jué)相似性進(jìn)行分組。MuZero會(huì)將其中一個(gè)圖片組的關(guān)鍵幀進(jìn)行壓縮,再參考關(guān)鍵幀去壓縮其它幀,在這一過(guò)程中,該算法會(huì)通過(guò)塊搜索(block search)來(lái)查找圖片中變化最小的區(qū)域,使得壓縮效果更好還能保證視頻質(zhì)量。
▲MuZero壓縮圖片組
最后,一組圖片組壓縮完成后,MuZero再按照同樣的步驟完成視頻其它部分圖片組的壓縮。
這些研究的早期結(jié)果表明MuZero有潛力成為一個(gè)更通用的工具,幫助研究人員在視頻壓縮過(guò)程中找到最佳解決方案。
04.結(jié)語(yǔ):通用人工智能工具的變革潛力已經(jīng)凸顯
當(dāng)下,Google DeepMind的AI工具正在使得數(shù)十億用戶(hù)在使用計(jì)算機(jī)的過(guò)程中節(jié)省時(shí)間和精力,包括從玩游戲到解決每臺(tái)計(jì)算機(jī)設(shè)備核心的復(fù)雜工程問(wèn)題。研究人員認(rèn)為,這僅僅是個(gè)開(kāi)始。
未來(lái),越來(lái)越多的通用人工智能工具或許可以?xún)?yōu)化為數(shù)字世界提供動(dòng)力的整個(gè)計(jì)算生態(tài)系統(tǒng),但與此同時(shí),支持這些工具背后的數(shù)字基礎(chǔ)設(shè)施需要更快、更高效、更可持續(xù)。因此,這一愿景的實(shí)現(xiàn)需要更多理論和技術(shù)上的突破。
不可否認(rèn)的是,通用人工智能工具的變革潛力已經(jīng)顯現(xiàn)出來(lái),并且研究人員已經(jīng)開(kāi)始考慮將其應(yīng)用于技術(shù)、科學(xué)和醫(yī)學(xué)等領(lǐng)域。