最近在杭州舉行的“2022英特爾中國數(shù)據(jù)中心合作伙伴技術(shù)峰會”上,聽到了兩個小案例,從某種程度上也反映了數(shù)據(jù)中心的發(fā)展重點和未來趨勢,先來分享如下:
兩個案例
北京星辰天合科技股份有限公司聯(lián)合創(chuàng)始人&首席運營官翟靜做了一個小小的統(tǒng)計:在工信部去年印發(fā)的《“十四五”信息通信行業(yè)發(fā)展規(guī)劃》中,提到“人工智能”21次、“網(wǎng)絡(luò)安全”77次,“數(shù)據(jù)”149次。
各行各業(yè)都在推行數(shù)字化的今天,數(shù)據(jù)的重要性不言而喻,翟靜的深切感受是關(guān)于大量數(shù)據(jù)的存儲方式。他談到,要把數(shù)據(jù)真正留存下來,業(yè)界主要有兩種方式:一種是傳統(tǒng)存儲陣列,一種是分布式軟件定義。翟靜把這兩種方式分別比作手機的“功能機”和“智能機”,傳統(tǒng)存儲基本是基于ASIC芯片,主要責(zé)任是讓數(shù)據(jù)保存更可靠、性能更好;而分布式軟件定義是基于通用的x86平臺的通用硬件能力,用軟件對數(shù)據(jù)進行資源池化、調(diào)度,去支撐云平臺。
當前,軟件定義存儲逐漸成為企業(yè)IT的主流選擇。據(jù)IDC統(tǒng)計,軟件定義存儲的市場規(guī)模在2017年約為30.59億,到2021年已經(jīng)達到了137億。從發(fā)展的角度看,軟件定義存儲的規(guī)模在5年前約是傳統(tǒng)存儲的1/4,到現(xiàn)在,軟件定義和超融合基本占據(jù)了整個存儲工作負載的一半左右。
站在軟件公司的角度,翟靜也分享了他對于存儲硬件的看法。在他看來,硬件會影響整個軟件定義存儲項目的成功,特別是下沉市場,一些客戶缺乏軟硬件集成的能力、運維的能力,就更為看重產(chǎn)品的易用性、安裝/運維的便利性。他強調(diào),所謂軟件定義一切,并不意味著不需要重視硬件平臺,反而先進、通用的硬件平臺是一切的基礎(chǔ),只有一個扎實的、開放的硬件平臺,才有健康的生態(tài)和生意。
如何為中國需求做更多事情?
根據(jù)工信部印發(fā)的《新型數(shù)據(jù)中心發(fā)展三年行動計劃(2021—2023年)》,到2023年底,新建大型及以上數(shù)據(jù)中心PUE降到1.3以下。硬指標與時間表的設(shè)定,將進一步加快綠色數(shù)據(jù)中心的普及。
當英特爾數(shù)據(jù)中心與人工智能集團副總裁兼中國區(qū)總經(jīng)理陳葆立,與海外同事就這一趨勢溝通時,同事的反應(yīng)出奇一致:沒聽說過PUE 1.3,什么是PUE?
其實,PUE(Power Usage Effectiveness)是用于測量IDC能源效率的指標,是用IDC總能耗除以IT設(shè)備能耗得來。IDC總能耗包含IT設(shè)備能耗和制冷、配電等系統(tǒng)能耗,PUE數(shù)值越靠近1說明非IT設(shè)備的能耗越少,能效水平越高。
自去年開始,英特爾中國戰(zhàn)略升級,進入2.0時代?!安顒e在哪里?原來更多是全球技術(shù)、產(chǎn)品提供給中國客戶,當然這個過程中包括適配不同軟硬件需求的工作,以及和中國生態(tài)伙伴的合作”, 陳葆立表示,“但現(xiàn)在我們想更貼近這個市場,為中國客戶定制解決方案,未來也會持續(xù)打造更符合中國本土的產(chǎn)品?!?/p>
回到“PUE 1.3”這個案例,這個海外同事并不熟悉的市場需求,在當下可能是個疑問,也可能是個機會。當前幾乎所有中國客戶都希望能達到更好的PUE,那么是不是可以通過本土團隊更好地賦能?陳葆立介紹說,“英特爾中國現(xiàn)有1.2萬余人,上海也有研發(fā)團隊,涵蓋了硬件和軟件人才,我們相信可以為中國的需求做更多事情?!?/p>
數(shù)據(jù)大行其道,遇上綠色計算和“英特爾中國2.0戰(zhàn)略”,會碰撞出什么樣的火花?
英特爾數(shù)據(jù)中心與人工智能集團副總裁兼中國區(qū)總經(jīng)理陳葆立
應(yīng)對新型數(shù)據(jù)中心建設(shè)核心需求
英特爾市場營銷集團副總裁、中國區(qū)數(shù)據(jù)中心銷售總經(jīng)理兼中國區(qū)運營商銷售總經(jīng)理莊秉翰表示,隨著“雙碳”戰(zhàn)略的確立,“新基建”、“東數(shù)西算”等國家工程的推進,中國數(shù)據(jù)中心建設(shè)正朝著高能效、高算力、高安全、高技術(shù)的方向邁進。
英特爾市場營銷集團副總裁、中國區(qū)數(shù)據(jù)中心銷售總經(jīng)理兼中國區(qū)運營商銷售總經(jīng)理
莊秉翰
英特爾正在應(yīng)對新型數(shù)據(jù)中心建設(shè)的三大核心需求:
首先,面對數(shù)據(jù)爆發(fā)和千行百業(yè)的數(shù)字化創(chuàng)新,需要針對復(fù)雜的場景和工作負載,搭建不同的系統(tǒng)級解決方案。
其次,國家對新型數(shù)據(jù)中心提出了數(shù)網(wǎng)協(xié)同、數(shù)云協(xié)同和云邊協(xié)同的三個協(xié)同要求。全國算力合理布局,建立新型數(shù)據(jù)中心的網(wǎng)絡(luò)協(xié)同機制,在感知、調(diào)度、編排三個維度上鋪設(shè)低時延網(wǎng)絡(luò),形成云網(wǎng)一體,算網(wǎng)融合、軟件定義的新型算力網(wǎng)絡(luò)。
此外,國家發(fā)改委明確規(guī)定,在未來數(shù)據(jù)中心的建設(shè)中,PUE需要在1.3以下,這是一個非常嚴格的要求。因此節(jié)能、綠色化、降低PUE成為未來發(fā)展的趨勢。如何更加綠色的處理數(shù)據(jù)成為重中之重,對滿足高速可持續(xù)的數(shù)字經(jīng)濟具有重要的戰(zhàn)略意義。
建立行業(yè)標準,加速可循環(huán)增長
英特爾數(shù)據(jù)中心平臺技術(shù)與架構(gòu)部中國區(qū)總經(jīng)理王飛表示,可持續(xù)發(fā)展已經(jīng)成為一個非常重要的話題,它不但涉及國計民生,也對行業(yè)、企業(yè)的發(fā)展起著至關(guān)重要的作用。在數(shù)據(jù)中心可持續(xù)發(fā)展方面,英特爾構(gòu)建了綠色數(shù)據(jù)中心解決方案矩陣,在先進的液冷技術(shù)上進行深度的聯(lián)合創(chuàng)新。同時,還通過建立行業(yè)標準,去最大化可循環(huán)經(jīng)濟的減碳效應(yīng)。
針對不同市場需求,英特爾最新推出了兩個服務(wù)器模塊化設(shè)計的行業(yè)標準:第一個標準是DC-MHS(Modular Hardware System),主要針對互聯(lián)網(wǎng)領(lǐng)域和企業(yè)的國際市場,其關(guān)注點主要是模塊的復(fù)用,通過標準的覆蓋可以極大減少產(chǎn)品的電子垃圾,有效降低產(chǎn)品在生產(chǎn)階段的碳排放。第二個標準是開放通用服務(wù)器平臺(Open Common Server Platform;OCSP),是英特爾聯(lián)合了多家國內(nèi)廠商共同推出的一個標準,主要針對通用服務(wù)器市場,在設(shè)計上更加強調(diào)對成本的優(yōu)化。這兩個標準的共同目標都是希望通過簡化設(shè)計、降低成本,通過靈活的模塊設(shè)計來組合出不同的系統(tǒng)設(shè)計。
此外在本次峰會上,綠色數(shù)據(jù)中心技術(shù)創(chuàng)新論壇正式成立,英特爾攜手論壇成員共同發(fā)布了《綠色數(shù)據(jù)中心創(chuàng)新實踐——冷板液冷系統(tǒng)設(shè)計參考》,旨在突破數(shù)據(jù)中心系統(tǒng)功耗限制,并在降低設(shè)計與使用成本的同時,建立并逐步完善冷板液冷的生態(tài)系統(tǒng),從而有效降低數(shù)據(jù)中心PUE值。
王飛表示,液冷技術(shù)是直接降低PUE的不二之選。數(shù)據(jù)中心冷卻系統(tǒng)大致可以分為兩類,一類是比較傳統(tǒng)的風(fēng)冷技術(shù),另外一類是日漸成熟的液冷技術(shù),而液冷又分為冷板式和浸沒式。相較于風(fēng)冷,液冷技術(shù)有更大的能效優(yōu)勢,因為它有更好的熱捕獲能力,對于浸沒式液冷來說,甚至可以達到近100%的熱捕獲能力。在液冷技術(shù)的加持之下,數(shù)據(jù)中心PUE甚至可以降到1.03左右。
盡管如此,液冷技術(shù)在大規(guī)模推廣方面仍存有不少挑戰(zhàn)。對于冷板式液冷來說,成本依然很高,供應(yīng)鏈、生產(chǎn)鏈并不是非常健全,如何去推動行業(yè)標準、健全產(chǎn)業(yè)鏈是當前挑戰(zhàn);對于浸沒式液冷來說,如何找到既滿足性能要求,又符合環(huán)保標準,同時做有效的產(chǎn)品驗證工作也是非常重要的驗證領(lǐng)域。
陳葆立表示,冷板技術(shù)比較成熟,當前最主要的問題是價格,而根本原因還是用戶少、用量規(guī)模小,英特爾現(xiàn)在就是希望能發(fā)動生態(tài)力量,去推動產(chǎn)品和技術(shù)的普及化。而浸沒式液冷還在早期階段,大家還在摸索過程中。至于兩三年之后究竟是冷板還是浸沒式液冷更好用,還要取決于當時的技術(shù)成熟度和成本,目前英特爾在這兩方面都在推進,希望和生態(tài)伙伴繼續(xù)深度合作,共同推動行業(yè)標準的設(shè)定和推廣,共同加速成熟設(shè)計的落地。
據(jù)阿里云首席架構(gòu)師鐘楊帆回顧,英特爾和阿里巴巴從2015年開始在浸沒式液冷領(lǐng)域展開合作,當時雙方看到,浸沒式液冷不僅能解決IT設(shè)備散熱問題,同時能夠?qū)UE做到極致。2015年,全球數(shù)據(jù)中心PUE約為1.8左右,通過浸沒式液冷技術(shù)可以把PUE降到1.09,同時服務(wù)器本身也能實現(xiàn)散熱能耗全部消除,真正做到IT能耗用于計算,PUE也能達到趨于1的理想值。
鐘楊帆表示,“我們證實了浸沒式液冷技術(shù)是未來綠色計算技術(shù)躍遷式的革命,所以2020年我們進一步擴大規(guī)模,實現(xiàn)了首個5A級的綠色液冷數(shù)據(jù)中心的大規(guī)模投產(chǎn),目前可以做到2-3萬臺服務(wù)器的規(guī)模。在未來持續(xù)演進的過程中,我們將持續(xù)投入做到更大規(guī)模。”
數(shù)據(jù)中心的全棧布局
數(shù)據(jù)中心基礎(chǔ)設(shè)施方面,英特爾注重全棧硬件產(chǎn)品組合,基于XPU戰(zhàn)略,打造了跨CPU、GPU、FPGA、IPU等多種架構(gòu)的算力資源,為多元化業(yè)務(wù)和應(yīng)用場景需求提供定制化算力服務(wù)。
對于數(shù)據(jù)中心來說,至強可擴展處理器是一款具有重要意義的產(chǎn)品。從2017年推出第一代至強可擴展處理器到現(xiàn)在,出貨已經(jīng)超過5千萬顆,可以說是全球的算力底座。去年第二季度發(fā)布的第三代至強可擴展處理器Ice Lake,目前全球已經(jīng)出貨600萬片,中國市場占據(jù)大約三分之一左右。他透露,第四代至強可擴展處理器Sapphire Rapids即將推出,不僅提供更多的內(nèi)核、更高的算力,也內(nèi)附了AI加速和安全加速等升級。
陳葆立介紹,通過在傳統(tǒng)CPU中加入AI加速指令,目前,最新一代至強可擴展處理器運行AI訓(xùn)練或推理應(yīng)用,已經(jīng)比3年前快了30倍以上。未來幾代至強系列處理器,英特爾也制定了全新的架構(gòu)策略并推出性能核(P-core)和能效核(E-core)并進的雙軌產(chǎn)品路線圖,旨在將兩個優(yōu)化的平臺整合為一個通用的、定義行業(yè)發(fā)展的平臺,并極大限度地增強了產(chǎn)品的每瓦性能和細分功能。
不過,面向千行百業(yè)不同的算力需求,除了硬件層面的升級,還需搭配豐富的軟件方案。從硬件接口軟件到操作系統(tǒng)到虛擬化再到底層的函數(shù)庫、中間件、平臺軟件、應(yīng)用軟件,以及為最終用戶提供最后一公里部署的服務(wù)和完整解決方案,軟件的類型紛繁復(fù)雜,且每一層都非常重要。陳葆立表示,為了幫助軟件開發(fā)商充分挖掘英特爾XPU平臺的性能和價值,英特爾主要從三方面進行推進:
第一,通過提供OneAPI軟件工具幫助開發(fā)者能夠跨平臺,用行業(yè)標準統(tǒng)一工具來開發(fā)軟件,避免了不同底層硬件需要不同的軟件開發(fā)環(huán)境,降低了復(fù)雜度,從而充分發(fā)揮硬件的能力。
第二,通過對開源軟件的貢獻,縮短軟件開發(fā)周期、降低開發(fā)成本。英特爾是眾多開源社區(qū)的重要貢獻者之一,包括操作系統(tǒng)、開源云解決方案、面向大數(shù)據(jù)和AI的開源項目,以及開源優(yōu)化管理工具等。
第三,英特爾和行業(yè)頭部應(yīng)用開發(fā)商合作,針對最終用戶進行了大量的軟硬件適配和優(yōu)化。工作。特別是對于運行國產(chǎn)軟件、操作系統(tǒng)的應(yīng)用,使得國產(chǎn)軟件在英特爾架構(gòu)上能夠跑得更快更好。
未來,服務(wù)器將不只是在數(shù)據(jù)中心,也可能在邊緣或其他地方。如何讓合作伙伴能快速、高效地打造不同方案,滿足各種不同需求?陳葆立談到,這就需要制定行業(yè)標準,提高投資報酬率。通過行業(yè)標準和模塊化的設(shè)計,能夠更好地求同存異,在快速開發(fā)過程當中,降低基本服務(wù)器研發(fā)的成本,同時還可以基于開放、通用的平臺進行創(chuàng)新,來滿足差異化需求。
支持算力網(wǎng)絡(luò)統(tǒng)籌建設(shè)
當前,國內(nèi)正在大力推進算力網(wǎng)絡(luò)建設(shè),在這一過程中,越來越多的玩家都開始參與了,包括運營商、互聯(lián)網(wǎng)廠商等。如何看待未來的生態(tài)格局?如何更有效地推進我國算力網(wǎng)絡(luò)的建設(shè)?
在莊秉翰看來,運營商、互聯(lián)網(wǎng)廠商會在“東數(shù)西算”部署中占據(jù)重要地位。在全國的算力網(wǎng)絡(luò)中,除了布局新的骨干型傳輸網(wǎng)絡(luò)之外,還要加入智能機制,這樣才能更實時、更安全地處理更復(fù)雜的負載,才能把整體的云網(wǎng)資源使用起來。同時,運營商、互聯(lián)網(wǎng)廠商的參與還帶來一個好處,就是不會發(fā)生太多的資源重復(fù)建設(shè)的問題。
他指出,運營商其實擁有很多算力資源,在中國,60%以上的IDC其實是運營商擁有的,網(wǎng)絡(luò)也是他們鋪設(shè)的,可以說運營商發(fā)展公有云是必然之路。
此外,邊緣計算現(xiàn)在越來越受到重視,而運營商本身就有很多機房布局在各個省、城市、鄉(xiāng)鎮(zhèn),只要對這些機房進行改造升級,就可以把機房變成邊緣服務(wù)器,再加上它的網(wǎng)絡(luò)資源,可以把以前的通信網(wǎng)絡(luò)變成包括中央和邊緣云的基礎(chǔ)架構(gòu)?!澳壳?,運營商和主流的互聯(lián)網(wǎng)公司已經(jīng)在商業(yè)和技術(shù)層面都展開合作了,這個趨勢在國內(nèi)將會繼續(xù)延續(xù)下去”, 莊秉翰表示,“英特爾樂于看到運營商的轉(zhuǎn)型,并支持他們建立公有云的能力。
寫在最后
算力正在成為基本的生產(chǎn)力,今天,一部手機的算力可能就相當于幾十年前一個超算中心的算力。而數(shù)據(jù)中心作為5G、人工智能、云計算等新一代數(shù)據(jù)技術(shù)的重要載體,已經(jīng)成為數(shù)字經(jīng)濟時代的底座,其產(chǎn)生、帶動的直接和間接經(jīng)濟效益也將逐漸增加。
數(shù)據(jù)中心不是“能耗怪獸”,它在耗能的同時也貢獻了重要的算力支撐。當前的重中之重,是構(gòu)建布局合理、技術(shù)先進、綠色低碳、算力規(guī)模與數(shù)字經(jīng)濟增長相適應(yīng)的新型數(shù)據(jù)中心,并持續(xù)向算力多元、算網(wǎng)協(xié)同、綠色低碳、智能敏捷等方向發(fā)展。
在新時代,英特爾如何重新思考算力底層建設(shè)、如何發(fā)揮生態(tài)優(yōu)勢和價值,去推進數(shù)據(jù)中心的轉(zhuǎn)型和升級,對于“雙碳戰(zhàn)略”、“新基建”、“東數(shù)西算”布局下的算力升級具有重要意義。廣泛的生態(tài)系統(tǒng)是英特爾的核心競爭力之一,不過,今天的產(chǎn)業(yè)鏈比以往更復(fù)雜、分工更細致、合作更緊密。在可預(yù)見的未來,英特爾如何攜生態(tài)之力,探索創(chuàng)新,推動產(chǎn)業(yè)的發(fā)展與升級,是值得關(guān)注的發(fā)展方向。