每一次連接,讓通信觸達(dá);每一次傳遞,引喜悅發(fā)生。歲末回首,通信產(chǎn)業(yè)2024留下了哪些足跡?“你”的2024又是如何度過?哪些變革觸動了你的心弦?歲末年初之際,通信世界全媒體推出以“‘我’的2024”為主題的2024年度盤點。本期為您帶來“我”的2024——論產(chǎn)業(yè),通過對全年產(chǎn)業(yè)發(fā)展分析,回顧這一年智算產(chǎn)業(yè)發(fā)展的精彩篇章。
近日,斯坦福大學(xué)根據(jù)研究論文、私人投資、專利等關(guān)鍵指標(biāo)分析了來自36個國家的人工智能生態(tài)系統(tǒng)數(shù)據(jù),中國排名第二,與美國仍有較大差距。我國生成式人工智能服務(wù)備案機(jī)制自2023年8月底開始實行,當(dāng)年備案62個;截至2024年11月17日,備案數(shù)量達(dá)到252個,2024年已凈增190個。
根據(jù)公開發(fā)布的項目招投標(biāo)信息,2024年國內(nèi)的200多個智算中心項目分布于26個省(市、自治區(qū))的100多個地市,有遍地開花之勢。本文從產(chǎn)業(yè)、集群、生態(tài)、市場和邊緣等多個角度分析了我國智算中心產(chǎn)業(yè)發(fā)展的現(xiàn)狀與成果,并進(jìn)行了展望。
產(chǎn)業(yè):智算的“新土壤”
2024年3月,為落實工業(yè)和信息化部等六部門聯(lián)合印發(fā)的《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計劃》,中國信息通信研究院與中國通信標(biāo)準(zhǔn)化協(xié)會聯(lián)合主辦的第二屆“華彩杯”算力創(chuàng)新應(yīng)用大賽啟動。大賽收到的8600個項目覆蓋信息傳輸、軟件信息技術(shù)服務(wù)業(yè)、公共管理、社會保障與社會組織,以及采礦、制造等19個行業(yè)門類、近30個細(xì)分行業(yè)。經(jīng)過初賽和決賽,最終不到1%的項目獲得全國總決賽榮譽(yù),“華彩杯”算力大賽亦成為我國算力方面重要賽事。
2024年9月,繼2023年國家標(biāo)準(zhǔn) GB/T 43331《互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)技術(shù)和分級要求》發(fā)布之后,中國信息通信研究院聯(lián)合業(yè)界起草的GB/T 44463《互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)總體技術(shù)要求》正式發(fā)布。該標(biāo)準(zhǔn)規(guī)定了互聯(lián)網(wǎng)數(shù)據(jù)中心及設(shè)備在基礎(chǔ)、高技術(shù)、高算力、高能效和高安全5個方面的技術(shù)要求,適用于互聯(lián)網(wǎng)數(shù)據(jù)中心及設(shè)備的規(guī)劃、設(shè)計、建設(shè)、運(yùn)維和評估,旨在為我國數(shù)據(jù)中心的建設(shè)、運(yùn)營與維護(hù)提供全面的技術(shù)指導(dǎo)和支持。
2024年9月,商湯智算中心通過理論算力、有效算力、算力能效、業(yè)務(wù)模型場景支持能力、加分項等5個維度的技術(shù)評測,獲得DC Tech 5A級智算中心算力性能認(rèn)證,成為國內(nèi)智算中心建設(shè)的“樣板間”;11月,儀電智算中心(松江)、中國聯(lián)通上海臨港智算中心A1樓相繼榮獲5A級智算中心算力性能認(rèn)證,成為標(biāo)桿。
2024年11月,在由中國信息通信研究院主辦的國際算力標(biāo)準(zhǔn)與應(yīng)用研討會(ISCT)上,來自工業(yè)和信息化部通信科技委、中國通信學(xué)會、中國信通院以及馬來西亞、德國、英國、哈薩克斯坦、印度尼西亞和美國的多國嘉賓共同發(fā)起《全球算力合作發(fā)展倡議》。該《倡議》計劃從算力技術(shù)研究創(chuàng)新、算力標(biāo)準(zhǔn)體系建設(shè)、算力人才交流合作等方面共同建設(shè)全球算力產(chǎn)業(yè)合作新生態(tài),為全球算力產(chǎn)業(yè)發(fā)展注入新活力。
集群:智算值得用的關(guān)鍵
2006 年 ,亞 馬 遜 正 式 推 出 了AWS,提供存儲、數(shù)據(jù)庫等服務(wù),是云計算的起點。2023年初,ChatGPT3.5 發(fā)布,成為智算進(jìn)入大眾視野的起點。2024年10月,xAI公司在19天內(nèi)完成十萬卡H100集群的部署,成為全球第一。按標(biāo)稱數(shù)據(jù),該集群的算力達(dá)到200EFlops(FP16),IT功率達(dá)到150MW。如果按照我們常用的2.5kW 為一個標(biāo)準(zhǔn)機(jī)架計算,該集群可以折算為60000個標(biāo)準(zhǔn)機(jī)架。
智算和云計算具有本質(zhì)區(qū)別。一般來說,云計算是把CPU虛擬化后以更小顆粒度進(jìn)行排列組合,并通過網(wǎng)絡(luò)提供各種計算、存儲服務(wù);而用于訓(xùn)練的智算則是把盡量多的GPU組成集群,提供更大規(guī)模的(不一定需要網(wǎng)絡(luò)接入)計算服務(wù)。
在規(guī)模化法則(Scaling Law)中,模型性能與參數(shù)量、數(shù)據(jù)集和算力等因素具有密切關(guān)系,參數(shù)量的提升,將帶來對算力需求的線性增長?;ヂ?lián)多個智算集群處理更大規(guī)模的訓(xùn)練,技術(shù)方面存在巨大挑戰(zhàn);互聯(lián)不同主體的智算集群,在商業(yè)邏輯方面存在諸多值得探討的問題。因此,在大模型訓(xùn)練場景下,各種所謂的算力調(diào)度是否能帶來實際應(yīng)用價值有待商榷。
生態(tài):智算可以用的關(guān)鍵
英偉達(dá)在幾十年的發(fā)展過程中,構(gòu)建了“GPU+NVlink+IB+CUDA”的計算網(wǎng)絡(luò)編程環(huán)境一體的生態(tài)體系,具有強(qiáng)大的競爭力。由于各種限制,以及國產(chǎn)訓(xùn)練AI芯片產(chǎn)能有限,我國搭建超萬卡規(guī)模集群難度極大,在這種情況下如何發(fā)展我國的人工智能成為一個新的課題。
計算和網(wǎng)絡(luò)的融合,最終是要解決計算的擴(kuò)展性問題。現(xiàn)在一個機(jī)器8 張GPU卡,以后可能是32張卡、256 張卡,甚至是1024張卡,這就涉及卡間通信是采用基于內(nèi)存語義的加載/存儲交互,還是采用基于網(wǎng)絡(luò)語義的讀/寫交互。美國的云廠商和設(shè)備商“抱團(tuán)取暖”,針對卡間互聯(lián)和機(jī)間互聯(lián)進(jìn)行了合作創(chuàng)新,組建UEC和UALink等產(chǎn)業(yè)聯(lián)盟,基于統(tǒng)一的網(wǎng)絡(luò)協(xié)議和標(biāo)準(zhǔn)進(jìn)行技術(shù)研發(fā),支持多廠商卡間高速互聯(lián)。
為解決我國企業(yè)各自開展AI芯片和網(wǎng)絡(luò)研發(fā)可能導(dǎo)致未來出現(xiàn)多種芯片需要通過多種網(wǎng)絡(luò)進(jìn)行互聯(lián)的問題,中國信息通信研究院聯(lián)合互聯(lián)網(wǎng)企業(yè)、電信運(yùn)營商等成立“AI網(wǎng)絡(luò)特別任務(wù)組”,將聚焦Scale-up和Scale-out技術(shù)進(jìn)行研究,求同存異、兼容并蓄,以期為我國計算網(wǎng)絡(luò)發(fā)展貢獻(xiàn)一份力量。
市場:智算用得好的關(guān)鍵
我國具有“應(yīng)用場景豐富”這一獨(dú)特優(yōu)勢,各類垂直大模型的使用,將是發(fā)展人工智能的突破口。一方面是大量的大模型應(yīng)用,并不是所有的模型企業(yè)都有能力自建智算集群;另一方面是大量規(guī)劃建設(shè)的算力中心,并不是所有的建設(shè)方都有充分的用戶資源。兩者之間如何實現(xiàn)匹配是業(yè)界面臨的新問題。為深入貫徹落實國家相關(guān)政策,推進(jìn)全國一體化算力網(wǎng)建設(shè)部署,在工業(yè)和信息化部的指導(dǎo)下,中國信息通信研究院全面推動中國算力平臺建設(shè),目標(biāo)實現(xiàn)“算力資源一本賬、算力監(jiān)測一張網(wǎng)、算力匹配一站式、算力決策一盤棋”。
中國算力平臺算力匹配系統(tǒng)已正式推出公測版,試運(yùn)行期間用戶注冊超百個,訪問量近萬次。系統(tǒng)包含算力廣場和模創(chuàng)空間兩大核心內(nèi)容,算力廣場擁有七大類泛算力產(chǎn)品,包含算力資源、模型服務(wù)、AI應(yīng)用、數(shù)據(jù)服務(wù)等在內(nèi)的百余件商品,具備在線“選→購→用→管”能力,同時為“供、需、服”生態(tài)位構(gòu)建“供應(yīng)、購買、分銷”支撐體系;模創(chuàng)空間以算力、算法(模型)、數(shù)據(jù)為基底,匯聚十余類熱門模型共建“算力+模型+數(shù)據(jù)+AI創(chuàng)作”空間,形成自下而上的智算市場新格局。
邊緣:智算推理的新場景
隨著AI發(fā)展面臨瓶頸的出現(xiàn),業(yè)內(nèi)關(guān)注點正在轉(zhuǎn)向新的研究領(lǐng)域,如“推理”和“AI代理”。今年早些時候,英偉達(dá)財報顯示,公司數(shù)據(jù)中心40%的收入來自推理業(yè)務(wù)。邊緣應(yīng)用中數(shù)據(jù)的計算和存儲需求逐年增長,云端處理在時延和隱私等方面顯得力不從心,邊緣計算應(yīng)運(yùn)而生。在邊緣計算誕生的若干年中,其發(fā)展不甚理想。隨著人工智能時代的到來,各類推理的應(yīng)用場景使得邊緣計算煥發(fā)新的生機(jī)。從根本而言,推理就是一種新的邊緣計算。
訓(xùn)練是讓模型從已有的數(shù)據(jù)中學(xué)習(xí)新能力,計算密度大,對算力要求較高;推理是給訓(xùn)練好的模型輸入新數(shù)據(jù),讓它解決同類型的新問題,對算力要求較低。在自動駕駛、智能家居、智慧醫(yī)療等場景下,邊緣推理技術(shù)的不斷發(fā)展催生出廣闊的應(yīng)用前景。在自動駕駛領(lǐng)域,推理可實現(xiàn)高效的圖像識別和目標(biāo)跟蹤,提高自動駕駛的安全性和可靠性;在智能家居領(lǐng)域,推理可實現(xiàn)智能語音識別和智能圖像識別等功能,提高家居的智能化水平;在智慧醫(yī)療領(lǐng)域,推理可實現(xiàn)醫(yī)學(xué)圖像識別和疾病診斷等功能,提高醫(yī)療服務(wù)的質(zhì)量和效率。據(jù)研究機(jī)構(gòu)報告,2023年人工智能推理芯片市場規(guī)模為158億美元,預(yù)計到2030年將達(dá)到906億美元,在2024—2030年預(yù)測期內(nèi)的復(fù)合年增長率為22.6%。由此可見,邊緣計算(推理)將迎來新的發(fā)展機(jī)會。
挑戰(zhàn):“卡”盡其用
25年前,英偉達(dá)發(fā)布了其首款GeForce GPU,經(jīng)過不斷的投入、并購和創(chuàng)新,建成如今的“AI帝國”,產(chǎn)生了巨大的經(jīng)濟(jì)效益和社會影響力。我國的智算發(fā)展起步較晚,但AI芯片技術(shù)路線較多。
“路雖遠(yuǎn)行則將至,事雖難做則必成”。過去十年,我國的數(shù)據(jù)中心產(chǎn)業(yè)在國家和地方主管部門的指導(dǎo)和支持下蓬勃發(fā)展,市場整體保持每年30%左右的增長。技術(shù)創(chuàng)新活躍,整機(jī)柜服務(wù)器、液冷、微模塊數(shù)據(jù)中心、智能無損網(wǎng)絡(luò)、COCI(云服務(wù)器)和OTII(邊緣服務(wù)器)等已經(jīng)成為全球領(lǐng)先的技術(shù),得到大規(guī)模部署應(yīng)用,且部分成果在算力“出?!钡倪^程中發(fā)揮了重要作用。
智算時代產(chǎn)業(yè)面臨新的難題,需要從業(yè)者全心投入。
首先,必須從賦能的角度出發(fā),在謀劃階段就應(yīng)考慮建成后的應(yīng)用,“卡”盡其用,將電力更多地轉(zhuǎn)化為算力,避免投資浪費(fèi);其次,必須從市場的角度出發(fā),充分發(fā)揮各市場主體的主動性和市場調(diào)節(jié)的靈活性,能做到及時響應(yīng)、及時調(diào)整,供需實現(xiàn)有序?qū)?;再次,必須從實際的角度出發(fā),多走訪調(diào)研,了解產(chǎn)業(yè)實際的困難和需求,精準(zhǔn)施策,讓產(chǎn)業(yè)政策更具引導(dǎo)價值;最后,必須從生態(tài)的角度出發(fā),只要規(guī)?;▌t還有效,構(gòu)建開放、包容的智算生態(tài)就刻不容緩。
作者:中國信通院云大所 郭亮
責(zé)編/版式:王禹蓉
審校:王 濤?梅雅鑫
監(jiān)制:劉啟誠