在第一波云端AI算力的暴漲中,GPU是當(dāng)仁不讓的王者,此外,還有各種針對深度學(xué)習(xí)等工作負載打造的專用AI芯片也迎來大發(fā)展。
不過,通信和計算就好比數(shù)據(jù)中心的兩個臂膀,如果一直提升算力,但是通信基礎(chǔ)設(shè)施跟不上,整體系統(tǒng)性能還是受限,無法發(fā)揮出真正的潛能。這也是為什么,業(yè)界越來越多在談?wù)撍憔W(wǎng)一體化、算網(wǎng)融合等等。
從數(shù)據(jù)中心長期的迭代方向來看,光網(wǎng)絡(luò)的鋪設(shè)、通信的密度、底層算力的生態(tài)設(shè)施建設(shè)等,都在逐漸升級的過程中。帶寬不斷提升,將有更大的數(shù)據(jù)量涌入,數(shù)據(jù)的處理將會越來越復(fù)雜,包括網(wǎng)絡(luò)協(xié)議處理、存儲壓縮、數(shù)據(jù)加密等,這些本不是CPU和GPU擅長的領(lǐng)域,該由誰來處理?DPU的提出背景就是應(yīng)對這些數(shù)據(jù)量和復(fù)雜性的指數(shù)級增長,作為專注于解決算力基礎(chǔ)設(shè)施層各種數(shù)據(jù)流量負載的芯片,它被寄予了數(shù)據(jù)中心三大支柱芯片之一的定位。
國際上,英偉達、英特爾、AMD、微軟等廠商都已經(jīng)在積極布局DPU,國內(nèi)這個賽道的熱度也在不斷上升,產(chǎn)品成熟度越來越好。
脫胎于中科院計算所計算機體系結(jié)構(gòu)國家重點實驗室的中科馭數(shù),是國內(nèi)較早進行DPU芯片研發(fā)的企業(yè)。日前,中科馭數(shù)發(fā)布了最新一代DPU芯片K2 Pro、軟件開發(fā)平臺HADOS、以及一系列針對數(shù)據(jù)中心基礎(chǔ)設(shè)施層業(yè)務(wù)痛點打造的DPU卡,意在重新定義DPU,解鎖更廣泛目標場景。
為什么重新定義DPU?
在復(fù)雜大型芯片每代產(chǎn)品普遍3~5年的研發(fā)周期中,中科馭數(shù)用6年時間,完成了三代芯片的迭代,平均每代芯片迭代僅為不到2年的時間。
中科馭數(shù)CEO鄢貴海表示,DPU是當(dāng)下算力基礎(chǔ)設(shè)施的核心創(chuàng)新之一,就好比數(shù)據(jù)網(wǎng)絡(luò)的高鐵時代,已經(jīng)不僅僅是連通城市的問題,而是徹底重構(gòu)了地理位置的邏輯距離。作為一家創(chuàng)新性企業(yè),中科馭數(shù)必須用一年走過別人三年的路,才有可能在市場競爭中贏得生存空間。
如何重新定義DPU,鄢貴海提出了兩個主要維度:第一,DPU的定義需要層次化,不應(yīng)只局限于芯片開發(fā),而是需要在芯片、軟件和平臺上同時發(fā)展;第二,不應(yīng)該用“DPU幫助卸載CPU工作負載”的狹義視角去看它,而應(yīng)該是更廣。他強調(diào),DPU能夠處理GPU和CPU都無法有效處理的任務(wù),如安全業(yè)務(wù)和分布式安全機制。考慮到分布式和大規(guī)模集群系統(tǒng)的需求,DPU也被視為實現(xiàn)算網(wǎng)融合的關(guān)鍵組件。
中科馭數(shù)的目標是為算力基礎(chǔ)設(shè)施提供DPU產(chǎn)品,解決算力資源的彈性擴展、高效互連、加速計算、統(tǒng)一運維等關(guān)鍵問題,打通數(shù)據(jù)中心算力的——“堰塞湖”?;诖?,中科馭數(shù)從三個維度重新定義了DPU價值:第一,架構(gòu)決勝,用先進的芯片架構(gòu)重新定義DPU芯片架構(gòu);第二,軟件護城,用最高兼容性來重新定義DPU的軟件系統(tǒng);第三,平臺上門,用最低的成本讓客戶接入DPU規(guī)?;渴鹋c業(yè)務(wù)驗證。鄢貴海強調(diào),中科馭數(shù)做芯片,最終是為了服務(wù)云,以上三方面將構(gòu)成算力基礎(chǔ)設(shè)施領(lǐng)域的“芯云計劃”。
第三代DPU芯片K2-Pro發(fā)布
發(fā)布會上,中科馭數(shù)第三代DPU芯片K2-Pro正式發(fā)布,是目前國內(nèi)首顆量產(chǎn)全功能DPU算力芯片,專為未來數(shù)據(jù)中心和云原生環(huán)境定制優(yōu)化。
中科馭數(shù)高級副總裁、CTO盧文巖表示,DPU的量產(chǎn)落地是檢驗其技術(shù)創(chuàng)新的“驗金石”,整個研發(fā)團隊的重心也一直是量產(chǎn)和實用。面臨底層架構(gòu)的復(fù)雜挑戰(zhàn),中科馭數(shù)從基礎(chǔ)理論出發(fā),用創(chuàng)新的體系結(jié)構(gòu)理論指導(dǎo)復(fù)雜的芯片架構(gòu)設(shè)計,主要基于自研KPU架構(gòu)以及國內(nèi)首個DPU指令集——KISA。
作為中科馭數(shù)上一代DPU芯片K2的量產(chǎn)版本,K2-Pro在功能、性能、穩(wěn)定性、靈活性、系統(tǒng)管理、能效性六大維度實現(xiàn)了對K2的升級。在數(shù)據(jù)處理方面,K2-Pro包處理速率翻倍至80Mpps,在網(wǎng)絡(luò)密集型應(yīng)用中能提供更高的吞吐量和更低的延遲;強化復(fù)雜業(yè)務(wù)支持,集成網(wǎng)絡(luò)卸載、流表卸載、存儲卸載及RDMA網(wǎng)絡(luò)卸載等多類型硬件卸載引擎,實現(xiàn)用輕量控制面支撐復(fù)雜業(yè)務(wù),復(fù)雜服務(wù)網(wǎng)格性能從400微秒降至30微秒以內(nèi),實現(xiàn)量級躍升;通過PPP、NP內(nèi)核及P4可編程架構(gòu),實現(xiàn)業(yè)務(wù)與同構(gòu)算力、異構(gòu)算力靈活擴展,用戶可以根據(jù)實際需求動態(tài)調(diào)整和優(yōu)化系統(tǒng)配置,相當(dāng)于讓算力得到自由延展;提供全面的片上與板級管理系統(tǒng),加強資源管理與穩(wěn)定性;并在DPU復(fù)雜場景下能耗降低30%,實現(xiàn)低功耗運行。
基于K2-Pro的架構(gòu)優(yōu)勢和在功能方面的設(shè)計考量,中科馭數(shù)推出了三大系列的6款DPU卡產(chǎn)品:分別是面向超低時延網(wǎng)絡(luò)的“思威”SWIFT系列產(chǎn)品——SWIFT-2200N、SWIFT-NDPP,面向高吞吐無損網(wǎng)絡(luò)的“福來”FlexFlow系列——FLEXFLOW-2200T、FLEXFLOW-2100R,以及面向軟件定義網(wǎng)絡(luò)的“功夫”Conflux系列——CONFLUX-2200P、CONFLUX-2200E。目前,這六款產(chǎn)品已經(jīng)上架中科馭數(shù)京東官方旗艦店,開啟預(yù)售。
HADOS 3.0 軟件已突破萬卡級別落地部署
如果說“性能”的關(guān)鍵是芯片,那么“好用和易用”的核心就是軟件。作為銜接硬件和上層應(yīng)用的橋梁,DPU基礎(chǔ)軟件是決定硬件是否好用的基礎(chǔ)。在本次發(fā)布會上,中科馭數(shù)正式宣布自研軟件開發(fā)平臺HADOS已全新升級到3.0版本,是中科馭數(shù)在DPU基礎(chǔ)軟件生態(tài)建設(shè)上的重大突破。
據(jù)介紹,HADOS 3.0專為DPU優(yōu)化設(shè)計,核心代碼量已經(jīng)超過 126 萬行,累計總代碼量近千萬行,擁有驅(qū)動、計算、存儲、網(wǎng)絡(luò)、安全等不同層次的API 數(shù)量高達2765個,并且擁有豐富的、開箱即用的模塊和功能。目前,HADOS已突破萬卡級別的落地部署,適配了8 款CPU平臺以及10大主流操作系統(tǒng)。在行業(yè)應(yīng)用上,已有金融、電信、能源、科研、云數(shù)據(jù)中心等多個行業(yè)在內(nèi)的數(shù)十家用戶部署使用HADOS平臺,如HADOS的超低時延協(xié)議棧結(jié)合中科馭數(shù)的DPU,已經(jīng)在國內(nèi)的證券交易等時延敏感場景批量落地使用。
中科馭數(shù)高級副總裁張宇表示,HADOS 3.0是一個里程碑式的版本,不僅是功能和代碼的迭代,更是對DPU應(yīng)用場景深度理解后的全面革新,體現(xiàn)了全面擁抱“敏捷開發(fā)”的理念和方法,以及對高效、靈活、安全、易用的極致追求,助力解決 DPU 廣泛落地高性能云數(shù)據(jù)中心。
首次呈現(xiàn)中科馭數(shù)DPU全方位云計算實踐
云是算力供給的一種最普遍的形式,無論是通用計算、還是智算,因此,支撐云基礎(chǔ)設(shè)施,也是DPU的核心價值體現(xiàn)。中科馭數(shù)聯(lián)合行業(yè)內(nèi)眾多合作伙伴共同打造的以數(shù)據(jù)網(wǎng)絡(luò)為核心的高性能云底座方案——馭云,也在本次發(fā)布會上正式亮相。
中科馭數(shù)應(yīng)用研發(fā)部總經(jīng)理陳巖介紹,馭云解決方案采用“IaaS on DPU”技術(shù)路線,依托于DPU的卸載能力,將云計算體系中的基礎(chǔ)設(shè)施層面完全下沉,為集群提供網(wǎng)絡(luò)轉(zhuǎn)發(fā)、存儲服務(wù)、安全防護、管理調(diào)度等能力,完成了整個云計算環(huán)境的構(gòu)建與運轉(zhuǎn),將服務(wù)器側(cè)的CPU與GPU算力全部預(yù)留給業(yè)務(wù)系統(tǒng)應(yīng)用,為云計算提供高性能、高吞吐、高安全的算力底座。
目前,中科馭數(shù)在信創(chuàng)園搭建的馭云開放平臺,集成了超400臺高性能服務(wù)器,采用創(chuàng)新的3U一體架構(gòu),深度融合CPU、GPU與DPU技術(shù)。中科馭數(shù)產(chǎn)品運營部副總經(jīng)理曹輝介紹,馭云開發(fā)平臺不僅為中科馭數(shù)自身的研發(fā)與數(shù)字化體系提供強大的算力支撐,還廣泛向客戶及生態(tài)伙伴敞開大門,提供DPU軟件開發(fā)平臺、科研教學(xué)及驗證服務(wù)、P4網(wǎng)絡(luò)編程平臺、聯(lián)合方案孵化服務(wù)、基于DPU的高性能異構(gòu)基礎(chǔ)設(shè)施資源服務(wù)以及DPU云市場六大服務(wù),旨在構(gòu)筑一個開放、先進的云算力設(shè)計與驗證平臺,加速高性能計算應(yīng)用的落地與推廣。
國產(chǎn)DPU走向何方?
從英偉達最新的產(chǎn)品路線圖來看,并未將DPU芯片單獨列出,而是將它包含在網(wǎng)絡(luò)平臺產(chǎn)品中進行了布局。雖然不能說弱化了DPU的定位,但對比前些年,英偉達剛剛收購以色列網(wǎng)絡(luò)芯片商Mellanox時,親手賦予了DPU“數(shù)據(jù)中心與CPU、GPU同為三大支柱”的光環(huán),如今,DPU在英偉達的全棧產(chǎn)品布局中確實越來越在退居“幕后”。這對國內(nèi)獨立的第三方DPU企業(yè)有什么啟發(fā)?
對此,鄢貴海首先認為,英偉達目前基本是以完整的高算力節(jié)點作為產(chǎn)品形態(tài),注重以集群方式做布局,產(chǎn)品的演進方向與該公司的全局思考密不可分。
他認為,英偉達的技術(shù)進步確實給國內(nèi)芯片企業(yè)提供了發(fā)展方向,尤其是在算力、精度配置和網(wǎng)絡(luò)速度方面。在這一背景下,國內(nèi)DPU企業(yè)應(yīng)該更加專注于核心競爭力,逐步提升技術(shù)水平和產(chǎn)業(yè)成熟度。同時,鄢貴海也指出國內(nèi)芯片產(chǎn)業(yè)在工藝、設(shè)計和產(chǎn)業(yè)成熟度上與國際巨頭存在差距,還需要時間和專注來彌補,企業(yè)發(fā)展和行業(yè)競爭是一個長期且復(fù)雜的過程,需要耐心和持續(xù)的努力。
預(yù)計今年,K2-Pro將突破10K出貨量級。鄢貴海強調(diào),這僅僅是開始,因為目標替代場景太多了,他并不擔(dān)心未來的市場容量,核心是要把DPU和現(xiàn)有業(yè)務(wù)集成好,能夠把流量無縫導(dǎo)入DPU設(shè)備中,迅速讓客戶能夠因為切換而獲益,市場自然會越做越全。
“如果非常要給一個數(shù)字,我覺得我們的DPU三年內(nèi)應(yīng)該可以突破百萬量級,在整個網(wǎng)絡(luò)市場占有率能夠達到30%”,鄢貴海信心滿滿地表示。