“東數(shù)西算”無疑是2022年一大熱詞,產(chǎn)業(yè)界和學(xué)術(shù)界就該話題進(jìn)行了深入的研究探討。
整體上來看,“東數(shù)西算”的實(shí)施,一方面是為了更好地利用西部相對(duì)優(yōu)惠的電力資源和優(yōu)異的氣候條件,推動(dòng)數(shù)據(jù)中心的優(yōu)化布局和產(chǎn)業(yè)整體的綠色低碳發(fā)展;另一方面希望借此帶動(dòng)西部的算力基礎(chǔ)設(shè)施建設(shè),促進(jìn)當(dāng)?shù)匦畔⒒降奶岣吆?a class="article-link" target="_blank" href="/tag/%E6%95%B0%E5%AD%97%E7%BB%8F%E6%B5%8E/">數(shù)字經(jīng)濟(jì)的發(fā)展。
算力和數(shù)據(jù)是數(shù)字經(jīng)濟(jì)的核心驅(qū)動(dòng)力
在數(shù)字經(jīng)濟(jì)時(shí)代,數(shù)據(jù)以幾何級(jí)數(shù)增長,隨之而來的是對(duì)強(qiáng)大算力的需求?!皷|數(shù)西算”從字面上看,是將東部的數(shù)據(jù)拿到西部計(jì)算。
數(shù)據(jù)來源于各種應(yīng)用,當(dāng)數(shù)據(jù)積累到一定的程度,且具有快速流轉(zhuǎn)、多樣類型和價(jià)值密度低等特征后,便成了大數(shù)據(jù)。從內(nèi)容格式來看,大數(shù)據(jù)分成結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),其中結(jié)構(gòu)化數(shù)據(jù)主要是指關(guān)系型數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)主要是音視頻文件等數(shù)據(jù)。從數(shù)據(jù)的使用頻率來看,大數(shù)據(jù)主要分為熱數(shù)據(jù)、溫?cái)?shù)據(jù)和冷數(shù)據(jù)。從存儲(chǔ)角度來看,數(shù)據(jù)可采用文件存儲(chǔ)、塊存儲(chǔ)和對(duì)象存儲(chǔ)等方式。從數(shù)字世界的角度來看,以上所有的數(shù)據(jù)最終都會(huì)轉(zhuǎn)變成0和1的二進(jìn)制數(shù)字,在網(wǎng)絡(luò)上傳輸并在芯片上計(jì)算、存儲(chǔ)。
《中國算力白皮書(2022年)》顯示,算力是數(shù)據(jù)中心的服務(wù)器通過對(duì)數(shù)據(jù)進(jìn)行處理后實(shí)現(xiàn)結(jié)果輸出的一種能力,最常用的計(jì)量單位是每秒執(zhí)行的浮點(diǎn)運(yùn)算次數(shù)(FLOPS)。算力由計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)共同支撐實(shí)現(xiàn),缺一不可。
從類型上分,算力主要包括通用算力、智能算力、超算算力。其中為人們所熟知的是CPU所提供的算力,例如網(wǎng)頁瀏覽;普通人接觸不多但是能享受到其服務(wù)結(jié)果的是GPU算力,例如電影渲染;更尖端的則是主要用于科研創(chuàng)新的超算算力,例如天氣預(yù)報(bào)。日漸興起的邊緣算力是對(duì)基于計(jì)算所在位置維度的特定算力的統(tǒng)稱,它可能包括通用算力和智能算力。由于應(yīng)用和規(guī)模的關(guān)系,邊緣超算算力存在的可能性幾乎為零。
由于具有不可移動(dòng)性,各類數(shù)據(jù)中心就是數(shù)據(jù)計(jì)算和存儲(chǔ)的中心,存進(jìn)去的是數(shù)據(jù),傳出來的還是各類數(shù)據(jù)。業(yè)界對(duì)是否所有大數(shù)據(jù)都適合拿到西部去計(jì)算的討論也頗為熱烈。總的原則是要根據(jù)大數(shù)據(jù)處理對(duì)時(shí)延的要求進(jìn)行分類判斷,對(duì)處理時(shí)延要求極高的大數(shù)據(jù)(例如金融交易、游戲等),應(yīng)該就近進(jìn)行計(jì)算,這也是“北上廣”等地區(qū)數(shù)據(jù)中心供不應(yīng)求的重要原因;對(duì)處理時(shí)延要求不高的大數(shù)據(jù)(如渲染、訓(xùn)練等),則可以拿到西部進(jìn)行計(jì)算和存儲(chǔ)。通過“東數(shù)西訓(xùn)”“東數(shù)西存”等方式,實(shí)現(xiàn)數(shù)據(jù)的差異化處理。
算力網(wǎng)絡(luò)賦能“東數(shù)西算”
“東數(shù)西算”工程啟動(dòng)后,算力和網(wǎng)絡(luò)這兩個(gè)原本獨(dú)立的詞組成了“算力網(wǎng)絡(luò)”這一新詞,成為業(yè)界特別是電信運(yùn)營商重點(diǎn)關(guān)注和研究的方向。
隨著寬帶通信和移動(dòng)通信的發(fā)展,我國數(shù)據(jù)流量日益增長。據(jù)工信部統(tǒng)計(jì),2015年,DOU(Dataflow of usage,每戶每月上網(wǎng)流量)為200M左右;2021年DOU達(dá)13.36GB,暴漲60多倍。數(shù)據(jù)的大幅增長帶動(dòng)了對(duì)數(shù)據(jù)中心的龐大需求。據(jù)中國信息通信研究院統(tǒng)計(jì),我國數(shù)據(jù)中心的在用機(jī)架數(shù)量從2011年的不到30萬架,增長到2021年的520萬架,10年期間增長近20倍。
數(shù)量如此之大的數(shù)據(jù)中心,使得原本主要為通信服務(wù)的網(wǎng)絡(luò),需要承擔(dān)數(shù)據(jù)中心間的流量傳輸,于是數(shù)網(wǎng)協(xié)同被提上了議事日程。在此過程中,電信運(yùn)營商通過第二平面的建設(shè),重點(diǎn)保障高QoS的業(yè)務(wù),滿足了部分需求。例如中國電信的CN2,支持?jǐn)?shù)據(jù)、語音、視頻等多種業(yè)務(wù)融合的應(yīng)用。
同一服務(wù)商的不同數(shù)據(jù)中心之間可以通過租用裸纖的方式建立DCI通道,但是隨著數(shù)據(jù)流量的增大以及各類應(yīng)用的發(fā)展,跨區(qū)域、跨服務(wù)商的數(shù)據(jù)中心網(wǎng)絡(luò)互聯(lián)需求日益強(qiáng)烈,算網(wǎng)協(xié)同就此進(jìn)入專家的研究視野。通過網(wǎng)絡(luò)的支撐,高效地調(diào)度不同服務(wù)商間的算力,形成算網(wǎng)協(xié)同的解決方案,是目前階段業(yè)界努力的方向。算力和網(wǎng)絡(luò)的協(xié)同程度如圖1所示。
圖1 算力和網(wǎng)絡(luò)的協(xié)同程度
集群間的網(wǎng)絡(luò)聯(lián)接主要是通過骨干網(wǎng),其建設(shè)運(yùn)營相對(duì)簡單。我國的5G網(wǎng)絡(luò)覆蓋和千兆光網(wǎng)接入的能力已經(jīng)進(jìn)入全球前列,網(wǎng)絡(luò)基礎(chǔ)設(shè)施較為完善。“東數(shù)西算”工程的實(shí)施,將為算網(wǎng)一體的服務(wù)提供更多的應(yīng)用場景,促進(jìn)算力和網(wǎng)絡(luò)的一體化發(fā)展。
算力資源不同于水電資源,傳輸?shù)氖菙?shù)據(jù)
有人說“算力隨處可取,像自來水一樣擰開龍頭就可以得到”,這個(gè)比喻很形象但不嚴(yán)謹(jǐn)。
水、電、氣,其屬性各不相同。水是物理存在的自然資源,通過管道運(yùn)輸,可以利用某些器皿進(jìn)行儲(chǔ)存;氣也是物理存在的自然資源,通過管道運(yùn)輸,但是看不見摸不著,可以通過器具儲(chǔ)存;電屬于二次產(chǎn)品,需要風(fēng)、光、水、煤等自然資源經(jīng)過轉(zhuǎn)換才能得到,通過電線傳輸。雖然近年來儲(chǔ)能技術(shù)發(fā)展迅速,但總體看儲(chǔ)存難度較大,性價(jià)比不高。
算力與水、電、氣的特征比較如表1所示,通過對(duì)比不難發(fā)現(xiàn),算力與水電、氣、均不相同。算力是由數(shù)據(jù)中心產(chǎn)生,服務(wù)器在哪里,算力就在哪里。在服務(wù)器不換位置的情況下,它不可能移動(dòng)也不能被傳輸。而且算力無法儲(chǔ)存,如果某段時(shí)間內(nèi)服務(wù)器沒有使用,那么這段時(shí)間的算力也不可能存儲(chǔ)起來供以后使用。
表1 算力與水、電、氣的特征比較
因此,擰開龍頭算力并不會(huì)流出來,流動(dòng)的只能是數(shù)據(jù),而算力更像是一個(gè)水池。數(shù)據(jù)源源不斷地流進(jìn)水池,一些數(shù)據(jù)留下了,另一些數(shù)據(jù)被處理后流出去,邊緣數(shù)據(jù)中心的作用也是如此。由此可見網(wǎng)絡(luò)在算力時(shí)代的重要性,沒有網(wǎng)絡(luò),數(shù)據(jù)就無法流動(dòng),數(shù)據(jù)中心也就發(fā)揮不了作用,成為“沒有生機(jī)的沙漠”。
算力調(diào)度是高效利用算力資源的關(guān)鍵
眾所周知,電網(wǎng)是可以調(diào)度的,“拉閘限電”是一種最直接的調(diào)度方式。這是由于電網(wǎng)發(fā)電機(jī)不能滿足用電負(fù)荷需求,或輸變電設(shè)備已無法承載更多的負(fù)荷,為保證電網(wǎng)或輸變電設(shè)備安全,人為采取了去除負(fù)荷措施。與電力不同,算力無法移動(dòng)、傳輸和存儲(chǔ),那么算力如何調(diào)度?
算力調(diào)度更多是指調(diào)用合理的算力去處理相應(yīng)的數(shù)據(jù),數(shù)據(jù)中心擁有多種算力,每種算力針對(duì)不同類型的數(shù)據(jù)。從計(jì)算類型來看,算力主要分為整型和浮點(diǎn)計(jì)算。整型計(jì)算適用于深度學(xué)習(xí)模型的推理運(yùn)算;半精度計(jì)算適用于深度學(xué)習(xí)模型的訓(xùn)練運(yùn)算;單精度計(jì)算多用于圖形應(yīng)用程序、圖像處理和機(jī)器學(xué)習(xí)等;雙精度浮點(diǎn)運(yùn)算主要用于超算領(lǐng)域。這里的分類維度和通用算力、智能算力、超算算力不是一一對(duì)應(yīng)的關(guān)系。一般來說,通用算力主要用來處理整型和半精度計(jì)算;智算算力更合適進(jìn)行單精度計(jì)算;超算算力特別擅長雙精度計(jì)算。各類算力中心重點(diǎn)處理的數(shù)據(jù)類型如表2所示。
表2 各類算力中心重點(diǎn)處理的數(shù)據(jù)類型
基于智算算力的數(shù)據(jù)中心即為智算中心?,F(xiàn)在業(yè)界對(duì)智算中心算力的宣傳多集中于多少FLOPS或者OPS等。需要注意的是,在單位不統(tǒng)一、精度不統(tǒng)一的情況下,不同智算中心的性能指標(biāo)是沒有可比性的。
算力無法儲(chǔ)存和傳輸,如果此時(shí)此刻的算力不能被利用,那么也就過期作廢了。因此,如果要高效全面地利用好所有的算力資源(包括不同類型的算力、不同數(shù)據(jù)中心的算力、不同集群的算力),就需要通過統(tǒng)一的調(diào)度平臺(tái)來實(shí)現(xiàn)統(tǒng)一的算力編排,并能在具有一定預(yù)期性的前提下,基于統(tǒng)一的算力定價(jià)機(jī)制完成算力的供給和使用,使得所有類型的算力都能“算”盡其用,所有的算力需求都能得到滿足,使“數(shù)據(jù)”和“算力”達(dá)到一種理想的平衡狀態(tài)。
算力和能效
一直以來,大家只要聊起數(shù)據(jù)中心,必然會(huì)與高能耗結(jié)合起來看。從技術(shù)的角度看,數(shù)據(jù)中心的高能耗是由芯片帶來的,因此除非芯片制程(如5nm)或者計(jì)算物質(zhì)(如量子)有根本性變化,否則高算力對(duì)應(yīng)高能耗是一個(gè)無法避免的事實(shí)。但是相比高能耗,大家更應(yīng)該看到的是,基于數(shù)據(jù)中心的各種數(shù)字化應(yīng)用給我們的工作和生活帶來的便利,為企業(yè)數(shù)字化轉(zhuǎn)型和國家數(shù)字經(jīng)濟(jì)發(fā)展貢獻(xiàn)的發(fā)動(dòng)機(jī)作用。
我國數(shù)據(jù)中心10年間增長近20倍,數(shù)據(jù)中心所消耗的能源絕對(duì)值一定是相應(yīng)增長的,但是經(jīng)研究,單位算力的能耗卻是一直在下降的。2020年初《Science》刊登的《重新校準(zhǔn)全球數(shù)據(jù)中心能耗估算》一文披露,從單計(jì)算實(shí)例來看,全球數(shù)據(jù)中心能耗強(qiáng)度自2010年以來每年下降20%。
PUE(電能利用效率)是業(yè)界公認(rèn)的評(píng)判數(shù)據(jù)中心能效高低的指標(biāo)。2022年11月,國家強(qiáng)制標(biāo)準(zhǔn)GB40879—2021《數(shù)據(jù)中心能效限定值及能效等級(jí)》正式實(shí)施,其中很重要的一條就是對(duì)PUE的要求。綠色低碳的深入發(fā)展,使得CUE(碳利用效率)也逐漸成為大家關(guān)注的焦點(diǎn)。
從數(shù)據(jù)中心整體的碳排放深入到IT設(shè)備的碳效指標(biāo),近期開放數(shù)據(jù)中心委員會(huì)(ODCC)發(fā)布的ODCC-2022-0500A《數(shù)據(jù)中心算力碳效白皮書》提出了一種服務(wù)器的算力碳效模型,定義如下:CEPS=C/S,其中C是碳排放量;S是服務(wù)器算力性能。通過測試和研究發(fā)現(xiàn),隨著算力的提升,不同芯片的碳排放增長曲線各不相同。
圖2 服務(wù)器使用階段內(nèi)算力碳效實(shí)測值
服務(wù)器使用階段內(nèi)算力碳效實(shí)測值如圖2所示,測試結(jié)果顯示,在服務(wù)器使用周期為5年的情況下,單位算力性能的碳排放量在20kg~60kg之間。由于IT設(shè)備特別是服務(wù)器在數(shù)據(jù)中心能耗中占比極大,數(shù)據(jù)中心的碳排放將在很大程度上取決于服務(wù)器和芯片,這逐漸成為數(shù)據(jù)中心綠色低碳發(fā)展的關(guān)鍵。
算力日漸成為新時(shí)代的新型生產(chǎn)力,成為數(shù)字經(jīng)濟(jì)發(fā)展的引擎。在算力的發(fā)展過程,可能會(huì)遇到各種各樣的問題。通過對(duì)這些問題的分析和研究,能讓我們對(duì)算力有更清晰的認(rèn)識(shí),也能更好地推進(jìn)產(chǎn)業(yè)發(fā)展和“東數(shù)西算”落地。
*本文首發(fā)于《通信世界》2022年12月10日? 第23期? 總第909期
作者:中國信息通信研究院云計(jì)算與大數(shù)據(jù)研究所 郭亮
責(zé)編/版式:沈新竹
審核:申晴
監(jiān)制:劉啟誠