寒武紀(jì)近日發(fā)布了2023年第一季度報(bào)告,顯示營收0.75億元,較上年同期增長19.52%,較上年同期虧損收窄11.26%。甚至在五一前夕,寒武紀(jì)總市值達(dá)到1034.48億元,這也是時隔兩年半多,寒武紀(jì)再破千億大關(guān)。
云端AI大爆發(fā),國產(chǎn)芯片“水漲船高”
從寒武紀(jì)2022年年報(bào)來看,營業(yè)收入較上年同期增加798.93萬元,同比增長 1.11%。其中,云端收入大幅增長,云端產(chǎn)品線收入2.19億元,較上年同期增長173.52%。寒武紀(jì)公告稱,隨著云端產(chǎn)品線思元290、思元370系列產(chǎn)品在多家頭部企業(yè)完成產(chǎn)品導(dǎo)入,帶動了云端產(chǎn)品線業(yè)務(wù)收入大幅增長。
隨著以ChatGPT為代表的AIGC相關(guān)應(yīng)用涌現(xiàn),AI相關(guān)概念股也持續(xù)上漲。寒武紀(jì)作為國內(nèi)AI算力芯片龍頭,也迎來了上市以來最大的風(fēng)口。
從2月中下旬開始,ChatGPT逐漸引爆了訓(xùn)練需求。某企業(yè)人士透露,其公司去年年末主要都是針對小模型訓(xùn)練做的預(yù)算,約不到3000萬。但經(jīng)過3月份對大模型應(yīng)用需求的調(diào)研后,已經(jīng)增加了9000萬預(yù)算。
市場需求之旺盛可見一斑。那么,寒武紀(jì)為此做好準(zhǔn)備了嗎?
寒武紀(jì)云端產(chǎn)品線的產(chǎn)品形態(tài)主要包括云端智能芯片和加速卡、訓(xùn)練整機(jī)及智能計(jì)算集群,而這基本是英偉達(dá)的領(lǐng)地。
圖:寒武紀(jì)主要產(chǎn)品線(來源:公司公告)
據(jù)了解,思元370芯片及加速卡目前與多家頭部互聯(lián)網(wǎng)企業(yè)在視覺、語音、圖文識別、自然語言處理等場景下完成了適配工作后,已經(jīng)進(jìn)入批量銷售環(huán)節(jié),實(shí)現(xiàn)了收入突破。
對于大模型領(lǐng)域,寒武紀(jì)公告稱:與某互聯(lián)網(wǎng)企業(yè)進(jìn)行了大模型訓(xùn)練的初步合作,目前仍處于技術(shù)探索和測試階段。
大模型訓(xùn)練國產(chǎn)替代,難在哪里?
3月中旬,有市場消息稱,百度“文心一言”將調(diào)用超大規(guī)模算力,并嘗試使用寒武紀(jì)思元590替代部分英偉達(dá)A100。
這一消息后來被寒武紀(jì)所辟謠。然而,根據(jù)所傳出的疑似百度內(nèi)部的消息是:“除了英偉達(dá)A100和寒武紀(jì)思元590,其他性能差一點(diǎn)的替代品也考慮。”
據(jù)了解,思元590是寒武紀(jì)最新一代云端智能訓(xùn)練芯片,該產(chǎn)品目前尚未正式發(fā)布。寒武紀(jì)董事長陳天石在一次大會中介紹,思元590采用MLUarch05全新架構(gòu),實(shí)測訓(xùn)練性能較在售旗艦產(chǎn)品有大幅提升,能夠提供更大的內(nèi)存容量和更高的內(nèi)存帶寬,其I/O和片間互聯(lián)接口也較上代實(shí)現(xiàn)大幅升級。
雖然還未正式上市,但思元590已然被寄予厚望,甚至被認(rèn)為“將是最早實(shí)現(xiàn)商業(yè)應(yīng)用的接近英偉達(dá)A100性能的國產(chǎn)Al訓(xùn)練芯片”。
寒武紀(jì)和百度雙方均未對合作細(xì)節(jié)做出正式回應(yīng),或許存有這樣的可能性:思元590在“文心一言”中可能小規(guī)模部署進(jìn)行測試,比如用于推理應(yīng)用中的小部分場景,進(jìn)入大模型訓(xùn)練中的可能性或許并不大。
其實(shí),在性能達(dá)到要求的前提下,國產(chǎn)芯片所能實(shí)現(xiàn)的成本優(yōu)勢,以及從防止“斷供”、“卡脖子”的戰(zhàn)略意義層面來看,都有其發(fā)展空間和必要性所在。在與一位業(yè)內(nèi)人士的對話中,問其:如果英偉達(dá)A100的庫存用完了,國內(nèi)企業(yè)寧愿買“閹割版”的芯片,也不會買國產(chǎn)芯片嗎?對方答:“如果國產(chǎn)算力芯片整體性價比能夠達(dá)到英偉達(dá)的60%-70%,就有購買的意愿,可惜目前還達(dá)不到。”
對于大模型訓(xùn)練所需的算力芯片,業(yè)內(nèi)認(rèn)為“只有英偉達(dá)的A100和A800能夠真正跑起來,國產(chǎn)GPU只能做小規(guī)模和中規(guī)模的訓(xùn)練和推理。”
那么,國產(chǎn)芯片的差距主要在哪?
一位業(yè)內(nèi)人士認(rèn)為,在性能提升的基礎(chǔ)上,國產(chǎn)芯片的穩(wěn)定性還需要時間去打磨。以大模型訓(xùn)練為例,通常進(jìn)行一次訓(xùn)練需要幾天甚至十幾天的時間,穩(wěn)定性必須足夠好。因?yàn)橛?xùn)練過程中,需要保存模型參數(shù),以便進(jìn)行推理及中斷后再訓(xùn)練使用。如果穩(wěn)定性不好,出現(xiàn)一兩個節(jié)點(diǎn)的宕機(jī),或是個別計(jì)算節(jié)點(diǎn)失效,那么就要推翻重來,導(dǎo)致訓(xùn)練時間延長。
而穩(wěn)定性取決于配套的軟件和工程能力。由于運(yùn)行過程中,需要解決很多BUG,還需要軟硬件結(jié)合、冗余的機(jī)制等等,而這些都需要付出相應(yīng)的時間和成本,也免不了商業(yè)應(yīng)用中前期的投入和磨合。
此外,英偉達(dá)在云端AI訓(xùn)練生態(tài)領(lǐng)域已布局多年,用戶遷移到國產(chǎn)芯片,需要付出一定的代碼工作量和移植成本,這也是國內(nèi)芯片企業(yè)的最大瓶頸。
面對云端這個巨大的市場,英偉達(dá)方面也絲毫沒有松懈。即使面臨美國商務(wù)部以安全問題為由,禁止其向中國客戶出售A100和更先進(jìn)的H100的情況下。針對禁令,英偉達(dá)面向中國市場先后推出了“合規(guī)版”的A800和H800,在關(guān)鍵參數(shù)方面(如:數(shù)據(jù)傳輸速率、所支持的內(nèi)存帶寬)進(jìn)行了一定下調(diào),以符合出口管制要求。
據(jù)傳,在英偉達(dá)A100停售前,國內(nèi)多家企業(yè)都進(jìn)行了囤貨。且?guī)准翌^部互聯(lián)網(wǎng)企業(yè)都向英偉達(dá)下了1.5萬-1.6萬的A800和H800訂單,每家金額在十幾億美元左右,大約能保證在2024年有足夠的產(chǎn)能。
國產(chǎn)芯片是否有追趕的可能性?
一份來自阿伯丁大學(xué)、MIT等機(jī)構(gòu)的研究,將算力演進(jìn)劃分為三個階段:前深度學(xué)習(xí)時代、深度學(xué)習(xí)時代、大規(guī)模時代。該研究顯示,在過去12年間(2010-2022年),ML訓(xùn)練算力增長了100億倍。2010 年之前,訓(xùn)練所需的算力增長符合摩爾定律,大約每20個月翻一番。自2010年代初深度學(xué)習(xí)問世以來,訓(xùn)練所需的算力快速增長,大約每6個月翻一番。而到了2015年末,隨著大規(guī)模ML模型的出現(xiàn),訓(xùn)練算力的需求提高了10到100倍,一種新的趨勢出現(xiàn)了。
根據(jù)OpenAI 近日的分析顯示,自 2012 年以來,AI訓(xùn)練任務(wù)中使用的算力,目前每3.5個月翻一倍。
大模型的“大”體現(xiàn)在海量參數(shù)訓(xùn)練,而這意味著需要極致算力。由于模型越大、參數(shù)越多,對算力的需求也更大。這無疑加劇了算力芯片的迭代速度。通常來講,算力芯片折舊時間最長不超過5年,一般為2-3年,在強(qiáng)力需求的推進(jìn)下,這一市場競爭會更為激烈。
對于企業(yè)用戶來講,追求大算力、高性能的芯片無可厚非,迭代跟不上需求的產(chǎn)品只能從業(yè)務(wù)中剝離。特別是對于AI云端訓(xùn)練這種高門檻的應(yīng)用,注定難以百花齊放,而會成為寡頭壟斷的領(lǐng)域。對于國內(nèi)芯片企業(yè)來說,既需要解決生態(tài)問題,又需要實(shí)現(xiàn)良好的性價比和穩(wěn)定性,才能讓企業(yè)有替代意愿。
那么,國產(chǎn)算力芯片還有追趕的可能性嗎?
一位業(yè)內(nèi)人士認(rèn)為,差距在一點(diǎn)點(diǎn)縮小,但是縮小的難度會越來越大。因?yàn)橛布度胧蔷薮蟮?,量產(chǎn)風(fēng)險也很高,如果沒有雄厚的資金持續(xù)投入,實(shí)現(xiàn)追趕首先有一定的難度。其次,如果英偉達(dá)保持現(xiàn)有的產(chǎn)品發(fā)布節(jié)奏,對于國內(nèi)廠商來講,差距可能會慢慢增大,特別是在相關(guān)禁令約束的情況下。
寫在最后
一顆芯片背后,不僅僅是一顆芯片,是長達(dá)數(shù)十年的平臺耕耘,包括軟硬件平臺、應(yīng)用框架等等。
頂著“國產(chǎn)AI芯片第一股”頭銜上市的寒武紀(jì),面向的是AI未來的星辰大海,以及國產(chǎn)替代的廣闊前景。但是,在云端這個極需自己“卷”自己的市場中,寒武紀(jì)正處于一場看似曙光在即、但仍遙遙無期的長跑中。
不僅是寒武紀(jì),對于所有AI芯片廠商來說都是如此,只有擴(kuò)大規(guī)模效應(yīng)、提升營收高速增長,同時,提升項(xiàng)目落地交付速度、降低耗費(fèi)成本,才有望打破這種“增收仍虧損”的死循環(huán),實(shí)現(xiàn)真正的追趕甚至超越。