云端AI芯片,已經(jīng)成為兵家必爭之地。
據(jù)ABI Research統(tǒng)計,從全球市場發(fā)展來看,這塊“大蛋糕”將在2024年達到191億美元的規(guī)模。
因此,全球范圍內(nèi)的主要芯片玩家們紛至沓來,早早地開始布局于此:
經(jīng)過數(shù)年時間的發(fā)展,由于英偉達GPU擁有豐富的產(chǎn)品線、強大的軟件生態(tài)等優(yōu)勢,目前在云端AI芯片市場處于“一家獨大”的局面。
但與此同時,GPU對于云端AI芯片也并非完美,存在著功耗大、價格昂貴等問題。
相對的,FPGA和ASIC因其低功耗、可編程等優(yōu)勢,使得一些國外的新晉廠商采取異構(gòu)計算打法切入,推出了更加適合云端通用計算的AI芯片。例如:
Cerebras Systems、Graphcore、Habana(已被英特爾收購)、Wave Computing等。
隨著云計算和AI的結(jié)合不斷深入,云端AI芯片的市場潛力不容小覷。在國外科技巨頭持續(xù)發(fā)力云端AI芯片之時,中國公司也敏銳地嗅到了這一市場方向,與美國同行們幾乎同時起步。
隨著深度學(xué)習(xí)的不斷發(fā)展,AI越來越多地滲入到數(shù)據(jù)中心來,滲透率將高達25%-30%,是一個非常龐大的市場。這就是被市場看作中國芯片黑馬——燧原科技所提出的觀點。
他們僅耗時18個月,便一次性流片成功,打造了國產(chǎn)AI云端訓(xùn)練芯片——邃思??芍^是在中國芯片界一戰(zhàn)成名。
而就在最近,量子位收到了一張來自燧原科技的邀請函。
起初小編未太在意。
但定睛一看,燧原科技貌似要有大動作了!
從一張邀請函中引發(fā)的猜想
初看這份邀請函,最先映入眼簾的便是“芯云長天”這個醒目的標題。
先從“芯云”二字入手:
“芯”應(yīng)當是指芯片。
“云”則是云端之意。
畢竟燧原科技位居“云端AI芯片”玩家之列,這種解釋應(yīng)當是沒錯了。
而“長天”二字,原意為:遼闊的天空。
結(jié)合前面的“芯”、“云”二字,應(yīng)當是希望在云端AI芯片的天地中大展宏圖。
再來看下邀請函中的第二個細節(jié)。
標題文字背后的這些曲線,似乎也有點文章,像是許多條收斂曲線。
咦?把這些元素規(guī)整一下,線索來了。
看來想要求解答案,還得從燧原科技的“起點”著手。
公開資料顯示,燧原科技是于2018年3月19日,在上海正式成立。
在成立1個月之后,拿到種子輪融資的燧原科技,便馬上進入到了研發(fā)芯片的階段。
而僅僅過了20個月,也就是在2019年12月,就發(fā)布了自研的第一款云端AI訓(xùn)練芯片邃思DTU,去年9月又宣布其云端訓(xùn)練加速卡“云燧T10”落地商用。
這種速度著實是有些驚人了。
要知道,業(yè)界設(shè)計一款GPU/CPU,從設(shè)計到最后的量產(chǎn),平均要耗時3年甚至更久。
更何況,邃思DTU還是從無到有地設(shè)計了全新的架構(gòu)、處理器和指令集。
而且這款芯片不僅僅是研發(fā)周期短,技術(shù)指標也是十分亮眼:
單卡單精度(FP32)算力達20TFLOPS
半精度及混合精度 (BF16/FP16)算力80TFLOPS
最大功耗為225W
12nm工藝,2.5D先進封裝
而在邃思DTU的基礎(chǔ)上,燧原科技分別又在云端訓(xùn)練和推理兩大陣營,發(fā)布了其自研產(chǎn)品。
訓(xùn)練方面,分別是面向云端數(shù)據(jù)中心的AI訓(xùn)練加速卡云燧T10和基于OCP(開放計算項目)OAM(開放加速模組)標準設(shè)計的AI訓(xùn)練加速模組云燧T11。
在推理方面,燧原科技所推出的產(chǎn)品,則是云燧i10。
它是一款面向云端數(shù)據(jù)中心的高性能人工智能推理加速卡,可廣泛應(yīng)用于計算機視覺、自然語言處理、語音識別與合成、知識圖譜等多類型云端推理場景。
除了硬件上的產(chǎn)品,燧原科技在軟件方面也推出了馭算——計算及編程平臺。
據(jù)公開資料顯示,馭算支持主流深度學(xué)習(xí)框架,并針對邃思芯片進行了特定優(yōu)化。
整個平臺不僅包括常用的算子加速庫,還可以為數(shù)據(jù)中心大規(guī)模訓(xùn)練集提供調(diào)度機制。
1張云端訓(xùn)練芯片、2款云端訓(xùn)練產(chǎn)品、1款云端推理產(chǎn)品,再加1個計算/編程平臺。
這就是燧原科技在成立三年多時間內(nèi)解鎖的成就。
而從這一路發(fā)展的路徑來看,燧原科技最先攻堅的云端AI芯片中,屬于最艱難的部分——訓(xùn)練芯片。講真,有被硬核到。
好了,挖完第二條線索,我們繼續(xù)。目光暫且移至邀請函的上方,最為醒目的便是這個半圓了。
雖然單看這個形狀猜不出太多深層的含義,但直觀其顏色和質(zhì)感,是那種黑科技硬核感沒錯了。
但俗話說的好:“站得高,看得遠”。把“鏡頭”抬高一些!真正的第三條線索,它來了!
與前方綿延的山脈連在一起看,這不就是個數(shù)字“2”嗎?
現(xiàn)在再結(jié)合剛才半圓的黑科技質(zhì)感,莫非是……最硬核的芯片要有到動作?
再大膽的猜測,莫非是要把邃思DTU來個升級?若真如此,那可將會是一個“連鎖反應(yīng)”。
因為最核心的云端AI芯片升級,其訓(xùn)練等產(chǎn)品自然也會在性能上有大幅度的提升。
同時,對大規(guī)模算法模型的支持能力也會顯著增強;而更進一步的,內(nèi)存、寬帶等屬性也得跟上升級的步伐。
但比這些更具意義的一點會是:
在國內(nèi),這將會成為首個實現(xiàn)二次迭代的云端訓(xùn)練芯片。
這是因為芯片的種類眾多,不同芯片的技術(shù)門檻也不一樣,AI芯片亦是如此。
而國產(chǎn)AI云端訓(xùn)練芯片,也正如文章開始講述的那樣,由于GPU等芯片的成熟,這個高端細分領(lǐng)域卻一直是處于一片空白的狀態(tài)。
也正如此,國產(chǎn)AI云端訓(xùn)練芯片用“一片藍海”來形容也是不足為過的。
若是邃思DTU真的能夠完成二次迭代,除了解鎖“全國首個”之外,更長遠的角度來看,更是能讓業(yè)界看到中國AI芯片設(shè)計的高水準。
以上便是量子位“從一張邀請函引發(fā)猜想”的故事。
在第一代訓(xùn)練產(chǎn)品“云燧T10”發(fā)布的18個月后,上述對于新品的各種猜測,是否會成真,一切答案將在7月7日的產(chǎn)品發(fā)布會中揭曉,讓我們拭目以待!
— 完 —
金磊 發(fā)自 凹非寺
量子位 報道 | 公眾號 QbitAI