2020年,英偉達(dá)以69億美元收購以色列網(wǎng)絡(luò)芯片公司Mellanox,并于同年推出其首款DPU產(chǎn)品,定位于CPU和GPU之后的“第三大算力支柱”——至此引燃DPU市場(chǎng)。兩年來,DPU在國內(nèi)外的熱度迅速躥升,國際巨頭在迅速布局:Intel推出IPU基礎(chǔ)設(shè)施處理器,今年又傳來AMD以19億美元收購DPU芯片廠商Pensando;國內(nèi)市場(chǎng)也是如此,玩家紛紛布局、資本分外青睞。
“一年完成三輪大體量融資”的背后
國內(nèi)DPU公司中,中科馭數(shù)布局較早,創(chuàng)始團(tuán)隊(duì)在計(jì)算機(jī)體系結(jié)構(gòu)領(lǐng)域有近二十年技術(shù)積累,在產(chǎn)品量產(chǎn)、商業(yè)落地、生態(tài)構(gòu)建、以及相應(yīng)的標(biāo)準(zhǔn)推動(dòng)等方面較為先行。
日前,中科馭數(shù)宣布完成數(shù)億元B輪融資,并同時(shí)公布第二代DPU芯片K2預(yù)計(jì)將在10月回片。據(jù)了解,該輪融資達(dá)到了超以往輪次融資規(guī)模的數(shù)億元,由金融街資本領(lǐng)投,建設(shè)銀行旗下建信股權(quán)跟投,老股東靈均投資、光環(huán)資本、泉宗資本連續(xù)三輪追投。
這也是過去一年內(nèi),中科馭數(shù)完成的第三輪大體量融資。融資和產(chǎn)品節(jié)奏都穩(wěn)健的中科馭數(shù),關(guān)鍵優(yōu)勢(shì)是什么?
追溯起來的話,該公司創(chuàng)始人兼CEO鄢貴海博士、聯(lián)合創(chuàng)始人兼CTO盧文巖博士,均來自國內(nèi)的科研院所。他們提出了軟件定義加速器技術(shù)(Software Defined Accelerator),自主研發(fā)了KPU(Kernel Processing Unit)芯片架構(gòu),并于2019年設(shè)計(jì)出業(yè)界首顆數(shù)據(jù)庫與時(shí)序數(shù)據(jù)處理融合加速芯片,已經(jīng)成功流片。中科馭數(shù)的DPU芯片,正是基于自研的KPU芯片架構(gòu),具有網(wǎng)絡(luò)協(xié)議處理、數(shù)據(jù)庫和大數(shù)據(jù)處理加速、存儲(chǔ)運(yùn)算、安全加密運(yùn)算等核心功能。
在技術(shù)路線方面,中科馭數(shù)2018年提出了“軟件定義加速器”,采用自主研發(fā)的敏捷異構(gòu)KPU芯片架構(gòu)。相較于傳統(tǒng)的ASIC或SoC DPU芯片架構(gòu),KPU有較高的靈活性,可以通過即時(shí)的軟件配置來定義芯片內(nèi)部數(shù)據(jù)運(yùn)算邏輯,在保障充沛算力的同時(shí),以最低功耗支撐更多運(yùn)算負(fù)載類型。在解決專用處理器設(shè)計(jì)碎片化問題的同時(shí),異構(gòu)眾核的技術(shù)架構(gòu)具有軟件定義可配置、設(shè)計(jì)周期短、性能更優(yōu)、計(jì)算高效的優(yōu)勢(shì),據(jù)稱目前已經(jīng)研發(fā)積累了百余類功能核。
專用DPU =定制化=不通用?
從被提出以來,DPU一直伴隨著“專用”這個(gè)字眼。鄢貴海分享,他被不止一次地問過:既然DPU是一顆專用芯片,是不是意味著應(yīng)用比較有限?通常需要通過定制化才能實(shí)現(xiàn)?它是不是非標(biāo)準(zhǔn)產(chǎn)品?是不是不夠通用,不能跟現(xiàn)有的生態(tài)環(huán)境很好地兼容?
對(duì)于這些問題,鄢貴海認(rèn)為有一定的片面性,甚至是認(rèn)知誤區(qū)。他指出,本質(zhì)上,“專用化、定制化、標(biāo)準(zhǔn)化”是三個(gè)完全不相關(guān)的概念。“專用化”強(qiáng)調(diào)的是應(yīng)用場(chǎng)景;“定制化”是實(shí)現(xiàn)一項(xiàng)技術(shù)的路徑選擇;“標(biāo)準(zhǔn)化”的背后則是工程化,其實(shí)是為了降低邊際成本。至于要不要定制化?可能很多時(shí)候取決于兩個(gè)因素:一是通用產(chǎn)品具不具備實(shí)現(xiàn)系統(tǒng)功能所需的支撐;二是成本問題,如果定制化可以讓成本更低、性能更高,其實(shí)是沒有理由非得用已有的標(biāo)準(zhǔn)組件去實(shí)現(xiàn)的。
基于他的解讀,不難理解DPU所說的“專用性”主要是針對(duì)應(yīng)用場(chǎng)景而言,并不能簡(jiǎn)單等同于定制化產(chǎn)品。那么,究竟該如何理解這個(gè)所謂“第三顆算力芯片”的功能定位和產(chǎn)品屬性?
英偉達(dá)給出過一個(gè)定義,可以說比較準(zhǔn)確地描述了DPU的功能,也相對(duì)容易理解——“DPU是用來把數(shù)據(jù)在正確的時(shí)間放到正確的位置”。
該如何理解? 鄢貴海認(rèn)為,正確的時(shí)間指的是延遲必須要滿足要求,帶寬要能達(dá)到數(shù)據(jù)量,自身的數(shù)據(jù)帶寬要做到匹配;正確的位置指的是要把所有的遠(yuǎn)程資源都能本地化,所有的跨節(jié)點(diǎn)訪問都要做的跟訪問本地資源是一樣的。
“其實(shí),DPU是什么不重要,重要的是DPU能做什么”,鄢貴海在幫助厘清DPU概念的同時(shí)指出,“從我們開始做DPU,就在試圖回答DPU是什么,而每一年我們對(duì)DPU的認(rèn)識(shí)都在加深?!?/p>
DPU=智能網(wǎng)卡?
數(shù)據(jù)中心服務(wù)器之間的網(wǎng)絡(luò)互聯(lián)有一套底層軟件系統(tǒng),這套軟件需要能完成網(wǎng)絡(luò)互聯(lián)協(xié)議,除此之外,還需要能跑一套數(shù)據(jù)中心必備的網(wǎng)絡(luò)安全系統(tǒng)。傳統(tǒng)上,這些處理跑在CPU上,而隨著智能網(wǎng)卡(SmartNIC)的逐漸普及,它正在網(wǎng)絡(luò)安全和網(wǎng)絡(luò)協(xié)議處理方面幫助CPU卸載任務(wù)。這與DPU的功能有著極高的重合,因此業(yè)界也有人認(rèn)為DPU就是智能網(wǎng)卡,或者說是增強(qiáng)的智能網(wǎng)卡。
那么,DPU與智能網(wǎng)卡的區(qū)別究竟是什么?是“新瓶裝老酒”嗎?盧文巖博士指出,可以說DPU是智能網(wǎng)卡中的核心芯片,或者說智能網(wǎng)卡是DPU的一個(gè)應(yīng)用場(chǎng)景,而事實(shí)上,DPU不僅僅是這一個(gè)場(chǎng)景,還可以用到更多地方。
至于相較于智能網(wǎng)卡的優(yōu)勢(shì)是什么?盧文巖表示,主要體現(xiàn)在資源和性能方面?,F(xiàn)在市面上基于FPGA的智能網(wǎng)卡,基本都卡在了20G和25G帶寬之下,很難突破達(dá)到兩個(gè)100G的帶寬。這主要因?yàn)閹追矫嫦拗疲菏紫仁荈PGA性能上不去,頻率很難超過300兆;其次是資源有限。因此,從性能和延時(shí)都沒法和DPU芯片比拼。而中科馭數(shù)的K2芯片,已經(jīng)實(shí)現(xiàn)了200G帶寬和1.2微秒延時(shí)。
他補(bǔ)充,今天不管是云、數(shù)據(jù)中心,還是混合云、私有云等,大部分傾向于DPU+CPU的方向。這是因?yàn)槿绻胱寯?shù)據(jù)中心的帶寬更好、延遲更低,就要搭建高速網(wǎng),而這會(huì)加劇成本壓力。如果用新的DPU方案,能夠把基礎(chǔ)打好,應(yīng)用靈活性更強(qiáng)。特別是對(duì)一些底層基礎(chǔ)能力很強(qiáng)的集成商,通過部署DPU,他們甚至可以重構(gòu)基礎(chǔ)設(shè)施底層的軟件,例如控制鏈、轉(zhuǎn)發(fā)鏈等都可以在DPU場(chǎng)景下重新做分布,這對(duì)優(yōu)化未來整體系統(tǒng)性能至關(guān)重要。
超低延時(shí)是一大核心需求
關(guān)于DPU未來的應(yīng)用方向,中科馭數(shù)高級(jí)副總裁張宇表示,從數(shù)據(jù)中心到云原生,再到算力網(wǎng)絡(luò)、元宇宙、自動(dòng)駕駛等,都將是DPU蓬勃發(fā)展的領(lǐng)域。
“在沒有DPU的時(shí)候,一些工作都是CPU在承擔(dān)。但是有了DPU之后,超低時(shí)延和超大帶寬,這其中不管哪一個(gè)場(chǎng)景都要做到極致,因?yàn)檫@才是DPU芯片的核心”,張宇認(rèn)為。
過去幾年,中科馭數(shù)一直在深耕超低時(shí)延場(chǎng)景,一個(gè)典型應(yīng)用就是金融科技。而這一市場(chǎng)幾乎被AMD和英偉達(dá)所占領(lǐng),AMD占到90%以上的市場(chǎng)份額,剩下的幾乎被英偉達(dá)占據(jù),思科也僅分到了很小的“蛋糕”。作為國內(nèi)甚至是唯一在這個(gè)市場(chǎng)“沖浪”的玩家,中科馭數(shù)的底氣是什么?又收獲了什么?
張宇表示,這首先離不開扎實(shí)的技術(shù)基礎(chǔ),中科馭數(shù)自研的軟硬件一體化加速平臺(tái),具備超低時(shí)延、高吞吐、低抖動(dòng)、高穩(wěn)定、高安全等優(yōu)勢(shì)。在超低時(shí)延領(lǐng)域,馭數(shù)產(chǎn)品商業(yè)環(huán)境實(shí)測(cè)均值僅為1.12微秒,創(chuàng)下全球超低時(shí)延最快紀(jì)錄,因此能夠在金融極速交易、金融風(fēng)控、極低時(shí)延數(shù)據(jù)庫異構(gòu)加速等應(yīng)用中落地。
其次是自研的軟件開發(fā)平臺(tái)HADOS,助力產(chǎn)品實(shí)現(xiàn)了靈活度高、穩(wěn)定性強(qiáng)、兼容性好,能夠全面適配國內(nèi)外多種操作系統(tǒng),大幅降低應(yīng)用軟件開發(fā)難度。
他透露,基于已有技術(shù)儲(chǔ)備和生態(tài)布局,中科馭數(shù)有望推出云原生服務(wù)網(wǎng)格全面加速方案,對(duì)比當(dāng)前的解決方案,時(shí)延性能可以提升5-10倍,為實(shí)時(shí)性要求極高的數(shù)據(jù)中心、工業(yè)控制、車路協(xié)同等應(yīng)用場(chǎng)景提供技術(shù)支撐。
攻克三大挑戰(zhàn)的路上
為了幫助行業(yè)認(rèn)識(shí)DPU并推動(dòng)它的標(biāo)準(zhǔn)化發(fā)展,中科馭數(shù)做了兩件事:2021年發(fā)布了行業(yè)首部DPU技術(shù)白皮書,2022年推出行業(yè)首部DPU評(píng)測(cè)技術(shù)白皮書。
DPU能否標(biāo)準(zhǔn)化?鄢貴海表示,DPU肯定是個(gè)好東西,標(biāo)準(zhǔn)化也能做成,但是有挑戰(zhàn)。從算力發(fā)展的三要素來看:首先性能必須高。第二,生產(chǎn)率如何,這背后其實(shí)是工程問題,就是能不能把系統(tǒng)做得更好用,兼容性做到最廣。第三就是成本,也就是能不能很好地規(guī)模化,做到供應(yīng)鏈可控、每個(gè)環(huán)節(jié)的成本都相對(duì)較低,以及售后體系更優(yōu)化。
作為初創(chuàng)公司,鄢貴海認(rèn)為一定是從上述第一個(gè)要素開始的,不論核心架構(gòu),還是核心軟件的積累,首先要解決第一個(gè)問題。
他坦言,中科馭數(shù)目前主要在解決第二個(gè)問題,因?yàn)楝F(xiàn)階段不論是軟件的頻繁迭代,還是做國產(chǎn)品牌的廣泛適配,都要解決DPU好用、易用的問題,從而在各個(gè)應(yīng)用場(chǎng)景中用起來。
而接下來要解決的就是成本問題——DPU目前還沒有大規(guī)模上量,不過,從它的應(yīng)用空間來看,最后的規(guī)模用量不會(huì)低于服務(wù)器的量,這也意味著還有很大的空間通過規(guī)模效應(yīng)來降低成本。
“這也是中科馭數(shù)從現(xiàn)階段基本形成商業(yè)閉環(huán),到變成一個(gè)在整個(gè)產(chǎn)業(yè)中有重要位置的公司,要突破的最后一道屏障”, 鄢貴海指出。
據(jù)了解,目前中科馭數(shù)在商業(yè)化拓展方面,圍繞“垂直深耕,水平擴(kuò)展”的策略,產(chǎn)品和方案已實(shí)現(xiàn)了一定的規(guī)?;逃?,僅2022上半年訂單已經(jīng)達(dá)到了2021全年的兩倍。
對(duì)于明年的預(yù)測(cè),鄢貴海認(rèn)為,看起來市場(chǎng)只會(huì)加速發(fā)展,目前終端用戶對(duì)DPU的應(yīng)用認(rèn)知已經(jīng)達(dá)到了一定水準(zhǔn),市場(chǎng)需求確實(shí)存在,前期的市場(chǎng)教育奏效了,客戶也愿意真金白銀去投入。未來,他們?cè)谧罱K做產(chǎn)品決策時(shí),最重要的選擇依據(jù)肯定還是整體的性價(jià)比,即性能是不是夠好,價(jià)格是不是足夠有優(yōu)勢(shì)。
這對(duì)于中科馭數(shù)這樣的第三方DPU廠商來說,就要把產(chǎn)品結(jié)構(gòu)做得更完善、方案整合得更好、軟件更穩(wěn)定易用、設(shè)備更完善,而這些最后都會(huì)成為產(chǎn)品的核心競(jìng)爭(zhēng)力?!翱雌饋砗芏嘈枨笫撬槠模阏虾靡院缶蜁?huì)變成你的核心競(jìng)爭(zhēng)力。相反,看起來相對(duì)短平快的路徑,最后就會(huì)可能變成自己的天花板”, 鄢貴海表示。
寫在最后
對(duì)于DPU的應(yīng)用量級(jí),業(yè)內(nèi)有一些公開預(yù)測(cè),認(rèn)為用于數(shù)據(jù)中心的DPU量級(jí)將達(dá)到和數(shù)據(jù)中心服務(wù)器等量的級(jí)別。一臺(tái)服務(wù)器可能會(huì)有一顆或者多顆DPU,好比每臺(tái)服務(wù)器必須配網(wǎng)卡一樣。以服務(wù)器每年新增大約1500萬臺(tái)來看,每顆DPU如果以萬元計(jì)算,將是千億量級(jí)的市場(chǎng)規(guī)模。
行業(yè)在不斷定義DPU,DPU也在重新定義行業(yè)。突破商業(yè)化的最后一道屏障,DPU將迎來真正廣闊無垠的藍(lán)海。