作者:張學(xué)睿 商湯智能產(chǎn)業(yè)研究院助理研究員
日前,“信息化百人會(huì)第八屆信息戰(zhàn)略論壇”在京拉開(kāi)帷幕。在本次論壇《東數(shù)西算工程推進(jìn)中的難點(diǎn)問(wèn)題與破解之道》“圓桌對(duì)話”環(huán)節(jié),商湯智能產(chǎn)業(yè)研究院院長(zhǎng)田豐根據(jù)“東數(shù)西算”各地區(qū)實(shí)際建設(shè)情況,提出了三個(gè)潛在挑戰(zhàn)性問(wèn)題。他表示,訓(xùn)練和推理數(shù)據(jù)跨省遷移難、通信網(wǎng)絡(luò)成本高;計(jì)算核心節(jié)點(diǎn)的數(shù)據(jù)資產(chǎn)運(yùn)營(yíng)權(quán)屬和數(shù)據(jù)商用合規(guī)性風(fēng)險(xiǎn);以及一地一議、標(biāo)準(zhǔn)不統(tǒng)一的地方專項(xiàng)債/專項(xiàng)資金模式,都給民營(yíng)科技企業(yè)投身“東數(shù)西算”產(chǎn)業(yè)浪潮中帶來(lái)不確定性投入風(fēng)險(xiǎn)。
一開(kāi)始要知道“東數(shù)西算”是什么?
“數(shù)”指數(shù)據(jù),“算”是算力,算力指對(duì)數(shù)據(jù)的處理能力,類似于農(nóng)業(yè)時(shí)代的水利、工業(yè)時(shí)代的電力,算力已成為數(shù)字經(jīng)濟(jì)發(fā)展的核心生產(chǎn)力。實(shí)施“東數(shù)西算”工程,就像“南水北調(diào)”“西電東輸”一樣,發(fā)揮我國(guó)體制機(jī)制優(yōu)勢(shì),支持數(shù)據(jù)中心向資源充裕的西部轉(zhuǎn)移,更多承接和保障東部數(shù)據(jù)處理需求。
圖:《東數(shù)西算工程推進(jìn)中的難點(diǎn)問(wèn)題與破解之道》“圓桌對(duì)話”
談及“東數(shù)西算”推進(jìn)過(guò)程中面臨的難題,田豐院長(zhǎng)表示,東數(shù)西算歸根結(jié)底是數(shù)字經(jīng)濟(jì)問(wèn)題,數(shù)據(jù)是需求,算力是供給,供需匹配才能蓬勃發(fā)展。同時(shí)指出在東數(shù)西算中民營(yíng)科技企業(yè)面臨的三個(gè)挑戰(zhàn)。
第一個(gè)挑戰(zhàn):用于訓(xùn)練和推理的數(shù)據(jù)跨省遷移難、遷移貴,偏高的通信網(wǎng)絡(luò)價(jià)格應(yīng)大幅降低。
網(wǎng)絡(luò)是數(shù)字經(jīng)濟(jì)的供應(yīng)鏈,網(wǎng)絡(luò)成本決定數(shù)字經(jīng)濟(jì)活躍程度。實(shí)體經(jīng)濟(jì)中,海鮮是空運(yùn)的,煤采用鐵路和船運(yùn),其成本差距接近10倍,數(shù)據(jù)也一樣。數(shù)據(jù)里面也有很多高精尖的、商業(yè)價(jià)值很高的數(shù)據(jù),也有海量的、價(jià)值沒(méi)有那么高、但也能夠產(chǎn)生很大的產(chǎn)業(yè)規(guī)模優(yōu)勢(shì)的數(shù)據(jù)。所以,怎么去運(yùn)?網(wǎng)絡(luò)“運(yùn)輸”的成本能不能足夠低?數(shù)字經(jīng)濟(jì)領(lǐng)域的“海運(yùn)”、“船運(yùn)”和“鐵路”急待供給側(cè)創(chuàng)新?這些問(wèn)題很關(guān)鍵。
數(shù)字經(jīng)濟(jì)的供應(yīng)鏈,即網(wǎng)絡(luò)傳輸成本。“東數(shù)西算”,有價(jià)值的數(shù)據(jù)傳輸是需求,如果數(shù)據(jù)遷移成本很高會(huì)反過(guò)來(lái)壓抑產(chǎn)業(yè)需求。
“東數(shù)西訓(xùn)”所針對(duì)的訓(xùn)練數(shù)據(jù),是海量的數(shù)據(jù):如果通過(guò)網(wǎng)絡(luò)運(yùn)輸會(huì)非常貴;如果通過(guò)線下的硬盤轉(zhuǎn)移方式,會(huì)面臨很大的安全風(fēng)險(xiǎn)。這些都使得數(shù)據(jù)遷移不太好做。
“東數(shù)西推”所針對(duì)的推理數(shù)據(jù),是沒(méi)有辦法跨過(guò)該省或者該區(qū)域的,并且可能涉及數(shù)據(jù)的權(quán)屬、數(shù)據(jù)的保護(hù)。所以推理的數(shù)據(jù)中心內(nèi)數(shù)據(jù)是很難去大量跨省遷移的,這都是實(shí)際中碰到的問(wèn)題。
第一個(gè)挑戰(zhàn)歸結(jié)為數(shù)字經(jīng)濟(jì)生命線的交通成本,即網(wǎng)絡(luò)的成本能不能進(jìn)一步的降低。
“網(wǎng)絡(luò)成本降低才能夠真正達(dá)到數(shù)字經(jīng)濟(jì)指數(shù)級(jí)的上漲。數(shù)據(jù)很多,但數(shù)據(jù)運(yùn)不出去還是沒(méi)有用。”田豐院長(zhǎng)稱。
第二個(gè)挑戰(zhàn):計(jì)算核心節(jié)點(diǎn)的數(shù)據(jù)資產(chǎn)運(yùn)營(yíng)權(quán)屬和數(shù)據(jù)商用合規(guī)性風(fēng)險(xiǎn)
第二個(gè)挑戰(zhàn)與東數(shù)西算節(jié)點(diǎn)建設(shè)的模式有關(guān)系。我們?cè)谌粘9ぷ髦腥バ抟粋€(gè)高速公路,修高速公路之前就得談好這10年的運(yùn)營(yíng)權(quán)歸誰(shuí),怎么做商業(yè)閉環(huán),建設(shè)數(shù)據(jù)中心也一樣。
現(xiàn)在建設(shè)東數(shù)西算的數(shù)據(jù)中心的時(shí)候,民營(yíng)企業(yè)參與到多少,民營(yíng)企業(yè)的運(yùn)營(yíng)權(quán)益有沒(méi)有受保護(hù),數(shù)據(jù)資產(chǎn)的歸屬,應(yīng)用的法律的合規(guī)性怎么處理,這些問(wèn)題目前為止都是很模糊的。所以民營(yíng)企業(yè)很擔(dān)心的是,花了很大的力氣、很多的投資建完數(shù)據(jù)中心,建完了以后公共的數(shù)據(jù)如何去挖掘?挖掘的過(guò)程中會(huì)不會(huì)又遇到很多合規(guī)性的一些風(fēng)險(xiǎn)?這是第二個(gè)挑戰(zhàn)。
第三個(gè)挑戰(zhàn):一地一議、國(guó)內(nèi)標(biāo)準(zhǔn)不統(tǒng)一的地方專項(xiàng)債/專項(xiàng)資金模式
第三個(gè)挑戰(zhàn)與東數(shù)西算數(shù)據(jù)中心的投入有關(guān)。很多地區(qū)通過(guò)新基建的專項(xiàng)債、專項(xiàng)資金投入建設(shè),但是每一個(gè)地區(qū)的政策都不一樣、標(biāo)準(zhǔn)也不一樣,甚至很多標(biāo)準(zhǔn)是沒(méi)有的。地方一邊做一邊摸索,這誠(chéng)然是一種創(chuàng)新,但企業(yè)現(xiàn)在是有很成熟的一套投資模式。從中央來(lái)講,是不是有可能定義在東數(shù)西算的超算中心、數(shù)據(jù)中心上資金配套的統(tǒng)一的模式,或一種建議的模式?這樣能夠?qū)崿F(xiàn)政府、國(guó)企還有民企都知道如何去做搭配型的投資,并且是一個(gè)全國(guó)可以復(fù)制的這種投資模式。
以上是民營(yíng)科技企業(yè)投身“東數(shù)西算”產(chǎn)業(yè)浪潮中三個(gè)不確定性投入風(fēng)險(xiǎn)。
圓桌對(duì)話中,田豐院長(zhǎng)還被問(wèn)及:商湯為什么要斥巨資建設(shè)這樣一個(gè)智算中心?它的商業(yè)模式到底是怎樣的?對(duì)于商湯來(lái)說(shuō),“東數(shù)西算”帶來(lái)了什么樣的發(fā)展機(jī)遇和挑戰(zhàn)?
就此,田豐院長(zhǎng)首先提到上海最近剛發(fā)布的《上海市培育“元宇宙”新賽道行動(dòng)方案(2022-2025年)》,指出元宇宙是一個(gè)巨大的算力的需求,其對(duì)算力的要求至少提升3個(gè)數(shù)量級(jí)。其次,上海的新能源車非?;?,不止是特斯拉向全球出口,還有很多品牌的國(guó)產(chǎn)新能源車,智能車的算力需求也很大。
田豐院長(zhǎng)稱,基建一定先行,所以上海政府的支持下,商湯提前兩三年就開(kāi)始建設(shè)AIDC(指“人工智能計(jì)算中心”或稱“商湯智算中心”)。用三個(gè)數(shù)字來(lái)對(duì)比可以看出商湯AIDC的實(shí)力。
第一個(gè)數(shù)字:1800
特斯拉自研的超算中心(超級(jí)計(jì)算機(jī)Dojo)算力是1800 Petaflops(1.8EFLOPS) 。
第二個(gè)數(shù)字:1895
Meta(原Facebook)建造的超級(jí)計(jì)算機(jī)RSC可提供1895(千萬(wàn)億次)TF32計(jì)算性能。
第三個(gè)數(shù)字:3740
商湯2022年剛剛建成亞洲最大的人工智能計(jì)算中心AIDC,峰值算力高達(dá)3740 Petaflops(1 Petaflop等于每秒1千萬(wàn)億次浮點(diǎn)運(yùn)算)。
可以看到中國(guó)在算力方面已經(jīng)遙遙領(lǐng)先。截至2021年底,商湯23個(gè)投入使用的超算集群總算力為每秒1170千萬(wàn)億次浮點(diǎn)計(jì)算,而新建的新一代人工智能計(jì)算中心也已于2022年1月在上海臨港正式落成啟用,設(shè)計(jì)峰值算力可達(dá)3740千萬(wàn)億次浮點(diǎn)計(jì)算,算力總計(jì)達(dá)到4910Petaflops,這個(gè)是商湯AIDC為什么有底氣說(shuō)“亞洲最大”。商湯AIDC得益于長(zhǎng)三角地區(qū)的智能車、元宇宙,以及AI科研產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型、智能制造強(qiáng)大的算力需求。
圖:信息化百人會(huì)第八屆信息戰(zhàn)略論壇
此外,田豐院長(zhǎng)還提出商湯AIDC具備三個(gè)特點(diǎn)。
任何一代的算力革命都是由需求和數(shù)據(jù)牽引的,商湯科技有自己的智慧城市、智慧商業(yè),包括數(shù)字世界和智能車這樣的一些業(yè)務(wù),所以更靠近應(yīng)用層,用軟件來(lái)去定義這個(gè)硬件的數(shù)據(jù)中心會(huì)更好地貼近產(chǎn)業(yè)的需求。
第二個(gè)特點(diǎn):運(yùn)營(yíng)定義建設(shè)。
一條路不是修好了就一定有車跑的,一個(gè)工廠也不是建好了就一定有生意的,所以商湯科技在所有地區(qū)的AI超算中心是負(fù)責(zé)運(yùn)營(yíng)的,從運(yùn)營(yíng)、市場(chǎng)商業(yè)閉環(huán)的角度,去定義區(qū)域的數(shù)據(jù)中心、AI超算中心應(yīng)該怎么去建。
第三個(gè)特點(diǎn):用國(guó)產(chǎn)化定義中國(guó)下一代的算力基礎(chǔ)設(shè)施。
商湯科技牽頭成立“人工智能算力產(chǎn)業(yè)生態(tài)聯(lián)盟”(簡(jiǎn)稱:智算聯(lián)盟),聯(lián)手國(guó)產(chǎn)芯片廠商,與清華大學(xué)、復(fù)旦大學(xué)、上海交通大學(xué)、中國(guó)信息通信研究院、中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院及行業(yè)伙伴共同推動(dòng)國(guó)產(chǎn)算力落地。
田豐院長(zhǎng)稱,以上三個(gè)特點(diǎn)是商湯科技努力做全球AI算力領(lǐng)先的樞紐的初心。