加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權(quán)保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • 為什么重新定義DPU?
    • 第三代DPU芯片K2-Pro發(fā)布
    • HADOS 3.0 軟件已突破萬卡級別落地部署
    • 首次呈現(xiàn)中科馭數(shù)DPU全方位云計算實踐
    • 國產(chǎn)DPU走向何方?
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

國產(chǎn)DPU加速創(chuàng)新:目標三年破百萬量級、市占率30%

06/25 11:18
5168
閱讀需 13 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

在第一波云端AI算力的暴漲中,GPU是當(dāng)仁不讓的王者,此外,還有各種針對深度學(xué)習(xí)等工作負載打造的專用AI芯片也迎來大發(fā)展。

不過,通信和計算就好比數(shù)據(jù)中心的兩個臂膀,如果一直提升算力,但是通信基礎(chǔ)設(shè)施跟不上,整體系統(tǒng)性能還是受限,無法發(fā)揮出真正的潛能。這也是為什么,業(yè)界越來越多在談?wù)撍憔W(wǎng)一體化、算網(wǎng)融合等等。

從數(shù)據(jù)中心長期的迭代方向來看,光網(wǎng)絡(luò)的鋪設(shè)、通信的密度、底層算力的生態(tài)設(shè)施建設(shè)等,都在逐漸升級的過程中。帶寬不斷提升,將有更大的數(shù)據(jù)量涌入,數(shù)據(jù)的處理將會越來越復(fù)雜,包括網(wǎng)絡(luò)協(xié)議處理、存儲壓縮、數(shù)據(jù)加密等,這些本不是CPU和GPU擅長的領(lǐng)域,該由誰來處理?DPU的提出背景就是應(yīng)對這些數(shù)據(jù)量和復(fù)雜性的指數(shù)級增長,作為專注于解決算力基礎(chǔ)設(shè)施層各種數(shù)據(jù)流量負載的芯片,它被寄予了數(shù)據(jù)中心三大支柱芯片之一的定位。

國際上,英偉達、英特爾、AMD、微軟等廠商都已經(jīng)在積極布局DPU,國內(nèi)這個賽道的熱度也在不斷上升,產(chǎn)品成熟度越來越好。

脫胎于中科院計算所計算機體系結(jié)構(gòu)國家重點實驗室的中科馭數(shù),是國內(nèi)較早進行DPU芯片研發(fā)的企業(yè)。日前,中科馭數(shù)發(fā)布了最新一代DPU芯片K2 Pro、軟件開發(fā)平臺HADOS、以及一系列針對數(shù)據(jù)中心基礎(chǔ)設(shè)施層業(yè)務(wù)痛點打造的DPU卡,意在重新定義DPU,解鎖更廣泛目標場景。

為什么重新定義DPU?

在復(fù)雜大型芯片每代產(chǎn)品普遍3~5年的研發(fā)周期中,中科馭數(shù)用6年時間,完成了三代芯片的迭代,平均每代芯片迭代僅為不到2年的時間。

中科馭數(shù)CEO鄢貴海表示,DPU是當(dāng)下算力基礎(chǔ)設(shè)施的核心創(chuàng)新之一,就好比數(shù)據(jù)網(wǎng)絡(luò)的高鐵時代,已經(jīng)不僅僅是連通城市的問題,而是徹底重構(gòu)了地理位置的邏輯距離。作為一家創(chuàng)新性企業(yè),中科馭數(shù)必須用一年走過別人三年的路,才有可能在市場競爭中贏得生存空間。

如何重新定義DPU,鄢貴海提出了兩個主要維度:第一,DPU的定義需要層次化,不應(yīng)只局限于芯片開發(fā),而是需要在芯片、軟件和平臺上同時發(fā)展;第二,不應(yīng)該用“DPU幫助卸載CPU工作負載”的狹義視角去看它,而應(yīng)該是更廣。他強調(diào),DPU能夠處理GPU和CPU都無法有效處理的任務(wù),如安全業(yè)務(wù)和分布式安全機制。考慮到分布式和大規(guī)模集群系統(tǒng)的需求,DPU也被視為實現(xiàn)算網(wǎng)融合的關(guān)鍵組件。

中科馭數(shù)的目標是為算力基礎(chǔ)設(shè)施提供DPU產(chǎn)品,解決算力資源的彈性擴展、高效互連、加速計算、統(tǒng)一運維等關(guān)鍵問題,打通數(shù)據(jù)中心算力的——“堰塞湖”?;诖?,中科馭數(shù)從三個維度重新定義了DPU價值:第一,架構(gòu)決勝,用先進的芯片架構(gòu)重新定義DPU芯片架構(gòu);第二,軟件護城,用最高兼容性來重新定義DPU的軟件系統(tǒng);第三,平臺上門,用最低的成本讓客戶接入DPU規(guī)?;渴鹋c業(yè)務(wù)驗證。鄢貴海強調(diào),中科馭數(shù)做芯片,最終是為了服務(wù)云,以上三方面將構(gòu)成算力基礎(chǔ)設(shè)施領(lǐng)域的“芯云計劃”。

第三代DPU芯片K2-Pro發(fā)布

發(fā)布會上,中科馭數(shù)第三代DPU芯片K2-Pro正式發(fā)布,是目前國內(nèi)首顆量產(chǎn)全功能DPU算力芯片,專為未來數(shù)據(jù)中心和云原生環(huán)境定制優(yōu)化。

中科馭數(shù)高級副總裁、CTO盧文巖表示,DPU的量產(chǎn)落地是檢驗其技術(shù)創(chuàng)新的“驗金石”,整個研發(fā)團隊的重心也一直是量產(chǎn)和實用。面臨底層架構(gòu)的復(fù)雜挑戰(zhàn),中科馭數(shù)從基礎(chǔ)理論出發(fā),用創(chuàng)新的體系結(jié)構(gòu)理論指導(dǎo)復(fù)雜的芯片架構(gòu)設(shè)計,主要基于自研KPU架構(gòu)以及國內(nèi)首個DPU指令集——KISA。

作為中科馭數(shù)上一代DPU芯片K2的量產(chǎn)版本,K2-Pro在功能、性能、穩(wěn)定性、靈活性、系統(tǒng)管理、能效性六大維度實現(xiàn)了對K2的升級。在數(shù)據(jù)處理方面,K2-Pro包處理速率翻倍至80Mpps,在網(wǎng)絡(luò)密集型應(yīng)用中能提供更高的吞吐量和更低的延遲;強化復(fù)雜業(yè)務(wù)支持,集成網(wǎng)絡(luò)卸載、流表卸載、存儲卸載及RDMA網(wǎng)絡(luò)卸載等多類型硬件卸載引擎,實現(xiàn)用輕量控制面支撐復(fù)雜業(yè)務(wù),復(fù)雜服務(wù)網(wǎng)格性能從400微秒降至30微秒以內(nèi),實現(xiàn)量級躍升;通過PPP、NP內(nèi)核及P4可編程架構(gòu),實現(xiàn)業(yè)務(wù)與同構(gòu)算力、異構(gòu)算力靈活擴展,用戶可以根據(jù)實際需求動態(tài)調(diào)整和優(yōu)化系統(tǒng)配置,相當(dāng)于讓算力得到自由延展;提供全面的片上與板級管理系統(tǒng),加強資源管理與穩(wěn)定性;并在DPU復(fù)雜場景下能耗降低30%,實現(xiàn)低功耗運行。

基于K2-Pro的架構(gòu)優(yōu)勢和在功能方面的設(shè)計考量,中科馭數(shù)推出了三大系列的6款DPU卡產(chǎn)品:分別是面向超低時延網(wǎng)絡(luò)的“思威”SWIFT系列產(chǎn)品——SWIFT-2200N、SWIFT-NDPP,面向高吞吐無損網(wǎng)絡(luò)的“福來”FlexFlow系列——FLEXFLOW-2200T、FLEXFLOW-2100R,以及面向軟件定義網(wǎng)絡(luò)的“功夫”Conflux系列——CONFLUX-2200P、CONFLUX-2200E。目前,這六款產(chǎn)品已經(jīng)上架中科馭數(shù)京東官方旗艦店,開啟預(yù)售。

HADOS 3.0 軟件已突破萬卡級別落地部署

如果說“性能”的關(guān)鍵是芯片,那么“好用和易用”的核心就是軟件。作為銜接硬件和上層應(yīng)用的橋梁,DPU基礎(chǔ)軟件是決定硬件是否好用的基礎(chǔ)。在本次發(fā)布會上,中科馭數(shù)正式宣布自研軟件開發(fā)平臺HADOS已全新升級到3.0版本,是中科馭數(shù)在DPU基礎(chǔ)軟件生態(tài)建設(shè)上的重大突破。

據(jù)介紹,HADOS 3.0專為DPU優(yōu)化設(shè)計,核心代碼量已經(jīng)超過 126 萬行,累計總代碼量近千萬行,擁有驅(qū)動、計算、存儲、網(wǎng)絡(luò)、安全等不同層次的API 數(shù)量高達2765個,并且擁有豐富的、開箱即用的模塊和功能。目前,HADOS已突破萬卡級別的落地部署,適配了8 款CPU平臺以及10大主流操作系統(tǒng)。在行業(yè)應(yīng)用上,已有金融、電信、能源、科研、云數(shù)據(jù)中心等多個行業(yè)在內(nèi)的數(shù)十家用戶部署使用HADOS平臺,如HADOS的超低時延協(xié)議棧結(jié)合中科馭數(shù)的DPU,已經(jīng)在國內(nèi)的證券交易等時延敏感場景批量落地使用。

中科馭數(shù)高級副總裁張宇表示,HADOS 3.0是一個里程碑式的版本,不僅是功能和代碼的迭代,更是對DPU應(yīng)用場景深度理解后的全面革新,體現(xiàn)了全面擁抱“敏捷開發(fā)”的理念和方法,以及對高效、靈活、安全、易用的極致追求,助力解決 DPU 廣泛落地高性能云數(shù)據(jù)中心。

首次呈現(xiàn)中科馭數(shù)DPU全方位云計算實踐

云是算力供給的一種最普遍的形式,無論是通用計算、還是智算,因此,支撐云基礎(chǔ)設(shè)施,也是DPU的核心價值體現(xiàn)。中科馭數(shù)聯(lián)合行業(yè)內(nèi)眾多合作伙伴共同打造的以數(shù)據(jù)網(wǎng)絡(luò)為核心的高性能云底座方案——馭云,也在本次發(fā)布會上正式亮相。

中科馭數(shù)應(yīng)用研發(fā)部總經(jīng)理陳巖介紹,馭云解決方案采用“IaaS on DPU”技術(shù)路線,依托于DPU的卸載能力,將云計算體系中的基礎(chǔ)設(shè)施層面完全下沉,為集群提供網(wǎng)絡(luò)轉(zhuǎn)發(fā)、存儲服務(wù)、安全防護、管理調(diào)度等能力,完成了整個云計算環(huán)境的構(gòu)建與運轉(zhuǎn),將服務(wù)器側(cè)的CPU與GPU算力全部預(yù)留給業(yè)務(wù)系統(tǒng)應(yīng)用,為云計算提供高性能、高吞吐、高安全的算力底座。

目前,中科馭數(shù)在信創(chuàng)園搭建的馭云開放平臺,集成了超400臺高性能服務(wù)器,采用創(chuàng)新的3U一體架構(gòu),深度融合CPU、GPU與DPU技術(shù)。中科馭數(shù)產(chǎn)品運營部副總經(jīng)理曹輝介紹,馭云開發(fā)平臺不僅為中科馭數(shù)自身的研發(fā)與數(shù)字化體系提供強大的算力支撐,還廣泛向客戶及生態(tài)伙伴敞開大門,提供DPU軟件開發(fā)平臺、科研教學(xué)及驗證服務(wù)、P4網(wǎng)絡(luò)編程平臺、聯(lián)合方案孵化服務(wù)、基于DPU的高性能異構(gòu)基礎(chǔ)設(shè)施資源服務(wù)以及DPU云市場六大服務(wù),旨在構(gòu)筑一個開放、先進的云算力設(shè)計與驗證平臺,加速高性能計算應(yīng)用的落地與推廣。

國產(chǎn)DPU走向何方?

從英偉達最新的產(chǎn)品路線圖來看,并未將DPU芯片單獨列出,而是將它包含在網(wǎng)絡(luò)平臺產(chǎn)品中進行了布局。雖然不能說弱化了DPU的定位,但對比前些年,英偉達剛剛收購以色列網(wǎng)絡(luò)芯片商Mellanox時,親手賦予了DPU“數(shù)據(jù)中心與CPU、GPU同為三大支柱”的光環(huán),如今,DPU在英偉達的全棧產(chǎn)品布局中確實越來越在退居“幕后”。這對國內(nèi)獨立的第三方DPU企業(yè)有什么啟發(fā)?

對此,鄢貴海首先認為,英偉達目前基本是以完整的高算力節(jié)點作為產(chǎn)品形態(tài),注重以集群方式做布局,產(chǎn)品的演進方向與該公司的全局思考密不可分。

他認為,英偉達的技術(shù)進步確實給國內(nèi)芯片企業(yè)提供了發(fā)展方向,尤其是在算力、精度配置和網(wǎng)絡(luò)速度方面。在這一背景下,國內(nèi)DPU企業(yè)應(yīng)該更加專注于核心競爭力,逐步提升技術(shù)水平和產(chǎn)業(yè)成熟度。同時,鄢貴海也指出國內(nèi)芯片產(chǎn)業(yè)在工藝、設(shè)計和產(chǎn)業(yè)成熟度上與國際巨頭存在差距,還需要時間和專注來彌補,企業(yè)發(fā)展和行業(yè)競爭是一個長期且復(fù)雜的過程,需要耐心和持續(xù)的努力。

預(yù)計今年,K2-Pro將突破10K出貨量級。鄢貴海強調(diào),這僅僅是開始,因為目標替代場景太多了,他并不擔(dān)心未來的市場容量,核心是要把DPU和現(xiàn)有業(yè)務(wù)集成好,能夠把流量無縫導(dǎo)入DPU設(shè)備中,迅速讓客戶能夠因為切換而獲益,市場自然會越做越全。

“如果非常要給一個數(shù)字,我覺得我們的DPU三年內(nèi)應(yīng)該可以突破百萬量級,在整個網(wǎng)絡(luò)市場占有率能夠達到30%”,鄢貴海信心滿滿地表示。

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風(fēng)險等級 參考價格 更多信息
ATXMEGA128A4U-MHR 1 Atmel Corporation RISC Microcontroller, 16-Bit, FLASH, AVR RISC CPU, 32MHz, CMOS, PQCC44, 7 X 7 MM, 1 MM HEIGHT, 0.50 MM PITCH, GREEN, PLASTIC, MO-220VKKD-3, VQFN-44
$4.48 查看
ATXMEGA16A4U-AUR 1 Microchip Technology Inc IC MCU 8BIT 16KB FLASH 44TQFP

ECAD模型

下載ECAD模型
$2.86 查看
STM32F103CBT6TR 1 STMicroelectronics Mainstream Performance line, Arm Cortex-M3 MCU with 128 Kbytes of Flash memory, 72 MHz CPU, motor control, USB and CAN

ECAD模型

下載ECAD模型
$9.18 查看
中科馭數(shù)

中科馭數(shù)

中科馭數(shù)致力于專用處理器研發(fā),為智能計算提供芯片和產(chǎn)品解決方案。圍繞DPU芯片打造了智能網(wǎng)卡系列產(chǎn)品和解決方案。

中科馭數(shù)致力于專用處理器研發(fā),為智能計算提供芯片和產(chǎn)品解決方案。圍繞DPU芯片打造了智能網(wǎng)卡系列產(chǎn)品和解決方案。收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

與非網(wǎng)資深行業(yè)分析師。主要關(guān)注人工智能、智能消費電子等領(lǐng)域。電子科技領(lǐng)域?qū)I(yè)媒體十余載,善于縱深洞悉行業(yè)趨勢。歡迎交流~