作者:暢秋
上周,一則外媒報(bào)道十分引人關(guān)注,根據(jù)投資銀行Bernstein的數(shù)據(jù),目前,全球40%的Arm服務(wù)器在中國大陸使用。40%,這個(gè)比重還是很高的,之前沒有預(yù)料到,畢竟,無論是CPU架構(gòu)IP開發(fā)和所有者,還是相關(guān)處理器在數(shù)據(jù)中心的應(yīng)用,主要還是由美國和歐洲公司主導(dǎo),包括AWS,Ampere,Google,F(xiàn)ujitsu,Microsoft和Nvidia在內(nèi)的多家芯片、系統(tǒng)設(shè)備和互聯(lián)網(wǎng)企業(yè)都在開發(fā)或采用了基于Arm架構(gòu)的SoC,美國的大企業(yè)正在其數(shù)據(jù)中心中擴(kuò)大Arm處理器的布署規(guī)模。在這種情況下,中國大陸相對(duì)少數(shù)的幾家重點(diǎn)關(guān)注Arm的企業(yè),如阿里巴巴,華為和飛騰等,能夠取得全球40%的份額,是相當(dāng)高的比例了。
仔細(xì)想一想,40%雖然在意料之外,但也在情理之中,畢竟,在中國大陸,有很多事業(yè)單位和國有金融企業(yè)和機(jī)構(gòu),它們所采用的核心設(shè)備及相關(guān)CPU的信息在媒體渠道很少能看到,不像美國的AWS,Google,Microsoft、Meta、甲骨文等企業(yè),采購和使用的IT設(shè)備及相關(guān)核心芯片經(jīng)常在媒體上看到。
另外,2019年之后,在美國的封鎖和打壓下,中國大陸系統(tǒng)設(shè)備廠商越來越難以買到英特爾和AMD的高性能服務(wù)器CPU,這在客觀上也迫使中國本土企業(yè)將更多資源和精力放在了基于Arm架構(gòu)自研的CPU上,雖然Arm授權(quán)的IP也受到了美國限制,但與直接購買英特爾和AMD的高性能服務(wù)器CPU相比,基于Arm自研CPU受到的限制會(huì)小很多,且有更多的操作空間。
可以說,在美國的限制政策下,中國大陸基于Arm架構(gòu)的CPU及服務(wù)器系統(tǒng)發(fā)展達(dá)到了一個(gè)新高度,在可預(yù)見的未來幾年,在全球市場的占比還將取得新突破。
上周,還有一則本土CPU取得技術(shù)和市場突破的消息,龍芯中科成功流片新一代四核處理器3A6000。
中國電子技術(shù)標(biāo)準(zhǔn)化研究院賽西實(shí)驗(yàn)室的測試結(jié)果顯示,龍芯3A6000在2.5GHz運(yùn)行頻率下,SPEC CPU 2006 base單線程定/浮點(diǎn)分值分別達(dá)到43.1/54.6分,SPEC
CPU 2006 base多線程定/浮點(diǎn)分值分別達(dá)到155/140分,雙DDR4-3200內(nèi)存通道Stream實(shí)測帶寬超過42GB/s,Unixbench實(shí)測分值超7400分。綜合相關(guān)測試結(jié)果,3A6000處理器總體性能與英特爾2020年上市的第10代酷睿四核處理器相當(dāng)。
相比于上一代龍芯3A5000桌面CPU,3A6000在相同工藝下單線程性能提升60%以上,全芯片多線程性能成倍提升。龍芯中科正在研發(fā)的服務(wù)器CPU將比上一代16核3C5000和32核的3D5000服務(wù)器CPU性能成倍提升。
作為中國本土CPU研發(fā)企業(yè)中的“異類”,早些年一直不被看好的龍芯,其價(jià)值在2019年之后得到突出體現(xiàn),近幾年,在自研指令集架構(gòu)LoongArch的基礎(chǔ)上,不斷推出新的、性能更高且能將功耗控制在一定水平的CPU,雖然也有一些波折,受到非議,但大方向還是對(duì)路的,未來幾年,相信還會(huì)有新的突破出現(xiàn)。
不止龍芯,近來有消息顯示,華為很可能會(huì)在年底將其自研的5G手機(jī)處理器帶回市場,如果真能實(shí)現(xiàn),無疑會(huì)是一針強(qiáng)心劑,無論是對(duì)華為,還是對(duì)中國本土手機(jī)處理器市場而言,都是如此。
華為5G手機(jī)處理器回歸的消息帶出了另一個(gè)話題,即中國本土10nm以下先進(jìn)制程芯片的制造。
由于受到美國限制,華為無法獲得臺(tái)積電或其它晶圓代工廠先進(jìn)制程產(chǎn)能,致使華為高端手機(jī)市占率每況愈下。因此,要想使5G手機(jī),特別是高端手機(jī)復(fù)活,有先進(jìn)制程工藝產(chǎn)線支持是關(guān)鍵。
此次,如果華為年底發(fā)布的新5G手機(jī)能搭載自研處理器的話,說明中國本土晶圓代工廠的制程工藝水平又上了一個(gè)臺(tái)階,備受關(guān)注的晶圓代工龍頭N+1制程工藝(與7nm工藝相近)很可能實(shí)現(xiàn)了新的突破,特別是在芯片量產(chǎn)的良率方面,或許能給市場提供更穩(wěn)定的支持。
中國本土晶圓代工廠,特別是以發(fā)展先進(jìn)制程工藝為目標(biāo)的廠商,在近幾年遇到了很大困難,核心問題就是先進(jìn)制程半導(dǎo)體設(shè)備,由于受到美國限制,無論是來自美國,還是來自歐洲的半導(dǎo)體設(shè)備廠商,都很難向中國本土晶圓廠出售先進(jìn)制程設(shè)備了,使得這些晶圓廠發(fā)展先進(jìn)制程工藝產(chǎn)線的工作極為艱難,只能靠美國限制政策正式生效前的短暫時(shí)期,拿到了有限數(shù)量的先進(jìn)設(shè)備,結(jié)合原有設(shè)備,組合出新產(chǎn)線,但這樣的晶圓廠硬件水平很難量產(chǎn)出高良率的先進(jìn)芯片。在這種情況下,產(chǎn)業(yè)對(duì)中國本土先進(jìn)半導(dǎo)體設(shè)備的呼聲越來越高。
近期,有消息稱,中國本土企業(yè)研制的先進(jìn)光刻設(shè)備將在年底出貨,雖然與ASML的先進(jìn)EUV和DUV設(shè)備相比還有不小的差距,但通過工藝技術(shù)的改進(jìn),例如采用多重曝光技術(shù),可以明顯縮小這種差距。這些對(duì)中國本土芯片制造業(yè)水平的提升是利好的。不過,總體而言,中國大陸先進(jìn)制程芯片制造的工藝水平與國際大廠相比,差距依然比較大,還需要本土半導(dǎo)體設(shè)備企業(yè)和科研院所不斷努力,爭取量產(chǎn)出更多先進(jìn)設(shè)備。
除了芯片設(shè)計(jì)和制造,中國大陸在高性能計(jì)算系統(tǒng)構(gòu)建方面也受到了限制,特別是當(dāng)下最為火爆的AI服務(wù)器系統(tǒng),由于無法買到英偉達(dá)最先進(jìn)的GPU產(chǎn)品A100和H100,中國大陸相關(guān)企業(yè),如阿里、騰訊和華為,只能退而求其次,采用現(xiàn)有處理器芯片,并簡化AI模型和程序。
據(jù)悉,通過采用英偉達(dá)低性能版本的A800和H800,騰訊推出了一款新的計(jì)算系統(tǒng),進(jìn)行AI模型訓(xùn)練。但是,這種方法的成本很高,因?yàn)镠800的用量大概是H100的三倍,才能獲得類似的效果。
有消息稱,為了控制成本,有中國本土公司設(shè)計(jì)出了采用不同芯片類型組合訓(xùn)練AI大模型的方法,例如,使用英偉達(dá)的A100、V100和P100,以及華為Ascends組合成一個(gè)系統(tǒng)。不過,這種方法的技術(shù)難度較大,且可靠性難以保證。
此外,中國本土公司還在軟件技術(shù)方面下功夫,以減少訓(xùn)練AI大模型的算力要求,也就是用軟件彌補(bǔ)硬件性能的不足。
?01、突破后的效應(yīng)
可見,雖然受到種種限制,但中國本土電子半導(dǎo)體產(chǎn)業(yè)依然在前進(jìn),當(dāng)然,這種進(jìn)步的速度是緩慢且艱難的。
在看到中國電子半導(dǎo)體相關(guān)企業(yè)尋找各種應(yīng)對(duì)策略,且有一定成效之后,美國政府又坐不住了,提出了新的限制措施,主要體現(xiàn)在:有意進(jìn)一步限制AI芯片出口,可能針對(duì)英偉達(dá)為中國大陸特供的A800和H800;加強(qiáng)對(duì)中國大陸電子半導(dǎo)體產(chǎn)業(yè)投資的限制;可能會(huì)進(jìn)一步限制中國本土成熟制程產(chǎn)線的發(fā)展。
這里特別關(guān)注一下成熟制程方面的限制。盡管美國去年10月出臺(tái)的規(guī)定減緩了中國大陸先進(jìn)制程芯片制造能力的發(fā)展,但基本上沒有影響14nm以上較為成熟制程技術(shù)的能力。成熟制程種類繁多,市場規(guī)模大,且競爭充分,是中國本土芯片制造業(yè)發(fā)展較好的選擇。
不久前,美國商務(wù)部長吉娜·雷蒙多在美國企業(yè)研究所的一次小組討論中表示:“中國投入大量資金補(bǔ)貼成熟制程芯片產(chǎn)能,這是我們需要思考并與盟友合作解決的一個(gè)問題?!卑莸钦晃桓呒?jí)官員表示,雖然沒有采取行動(dòng)的時(shí)間表,但正在收集相關(guān)信息。
就目前情況看,美國在成熟制程方面限制中國本土產(chǎn)業(yè)發(fā)展的顧慮較多,其中很重要的一項(xiàng)就是如果中國大陸成熟制程芯片產(chǎn)能大幅減少的話,美國需要轉(zhuǎn)移相關(guān)產(chǎn)能,且規(guī)模很大,這樣,很多美國企業(yè)需要承擔(dān)相應(yīng)成本,而美國企業(yè)并不愿意投資那些必須與接受大量政府補(bǔ)貼的中國大陸晶圓廠競爭的產(chǎn)線。據(jù)悉,美國政府正在衡量西方半導(dǎo)體公司投資此類項(xiàng)目的意愿,然后再?zèng)Q定采取什么行動(dòng)。
與美國政府已采取或想采取的行動(dòng)不同,美國半導(dǎo)體企業(yè),特別是行業(yè)排名前列的芯片大廠,都十分看重在中國大陸的發(fā)展,繼英偉達(dá)之后,英特爾于近期推出了中國特供版本AI芯片Gaudi 2。而且,就在上周,AMD也表達(dá)了推出中國專供版本AI芯片的意愿,該公司CEO Lisa Su表示,AMD看到了中國大陸AI市場的銷售潛能,不排除為相關(guān)客戶開發(fā)定制化產(chǎn)品的可能。她說:“我們的計(jì)劃當(dāng)然會(huì)遵守美國的出口管制規(guī)定,但我們也確實(shí)相信,有機(jī)會(huì)為正在尋找 AI 解決方案的中國大陸客戶開發(fā)產(chǎn)品,我們會(huì)繼續(xù)努力朝那個(gè)方向走。”
Lisa Su沒有詳細(xì)說明AMD的計(jì)劃,如果做的話,該公司可能會(huì)優(yōu)化一些Instinct MI系列加速器,例如計(jì)劃在今年第四季度推出的最新Instinct
MI300。
除了推出定制化芯片,英特爾還于近期與深圳市南山區(qū)政府合作,成立了英特爾大灣區(qū)創(chuàng)新中心,重點(diǎn)關(guān)注人工智能、芯片應(yīng)用和邊緣計(jì)算。英特爾的這一舉動(dòng)似乎釋放出了一個(gè)信號(hào),那就是不久前英特爾、英偉達(dá)和高通等美國芯片巨頭CEO與白宮高層進(jìn)行了閉門會(huì)談,表達(dá)不愿意失去中國大陸市場的態(tài)度和決心,或許,會(huì)談期間,芯片大廠與美國政府達(dá)成了某種妥協(xié)或默契,使得像英特爾這樣的美國芯片巨頭敢于在當(dāng)前的形勢下做出與深圳市深化合作的決定。當(dāng)然,這樣的合作肯定不是在幾天時(shí)間內(nèi)想出并執(zhí)行的,相信已經(jīng)籌備了一段時(shí)間,但最終決定執(zhí)行,還是要將美國政府的態(tài)度和未來政策作為重要參考要素的。
面對(duì)美國政府不斷變化的限制措施,以及美國芯片廠商多個(gè)版本的專供芯片,未來,中國本土設(shè)計(jì)和制造中高端芯片的決心是否會(huì)隨著國際供應(yīng)鏈的松動(dòng)而發(fā)生變化呢?
我們要看到,中國專供版芯片只是臨時(shí)解決方案,并不能從根本上解決問題,對(duì)于那些美國芯片廠商來說,開發(fā)定制化芯片來應(yīng)對(duì)美國政府出口限制政策是對(duì)研發(fā)資源的巨大浪費(fèi),對(duì)于中國本土產(chǎn)業(yè)來說,這樣的專供芯片具有很強(qiáng)的不確定性,長遠(yuǎn)來看,依然是在被美國牽著鼻子走。
因此,即使中國大陸企業(yè)會(huì)購買這些專供版芯片,也不能完全依賴美國供應(yīng),更不能放棄自己的產(chǎn)業(yè)鏈和生態(tài)系統(tǒng)建設(shè),中國必須發(fā)展本土的高端芯片制造業(yè)。
?02、未來的極限在哪里?
據(jù)統(tǒng)計(jì),今年6月,中國大陸芯片產(chǎn)量達(dá)到321.5億個(gè),同比增長5.7%,而前5個(gè)月芯片進(jìn)口量同比下降約20%。來自海關(guān)總署的消息顯示,今年前7個(gè)月,中國大陸進(jìn)口集成電路2701.7億個(gè),同比減少16.8%,價(jià)值1.32萬億元,同比下降16.2%。
可以看出,中國本土芯片產(chǎn)量在持續(xù)增長,進(jìn)口在減少,總體來看,芯片自給率有所提高。不過,必須看到,本土生產(chǎn)的多為中低端產(chǎn)品,而進(jìn)口的則以中高端產(chǎn)品為主。
在可預(yù)見的未來一段時(shí)期內(nèi),伴隨著美國不斷變化的限制政策,中國大陸需要在芯片設(shè)計(jì)、制造,以及系統(tǒng)集成方面不斷取得突破,才能爭取主動(dòng)權(quán),不陷入被動(dòng)泥潭。
芯片設(shè)計(jì)方面,在沒有最先進(jìn)EDA工具和國際先進(jìn)設(shè)計(jì)經(jīng)驗(yàn)輔助的情況下,中國本土企業(yè)能否設(shè)計(jì)出與國際高水準(zhǔn)保持同步的芯片?相信這一點(diǎn)實(shí)現(xiàn)起來,難度比芯片制造要小很多。目前,中國本土多家芯片設(shè)計(jì)企業(yè)都已具備先進(jìn)制程芯片設(shè)計(jì)能力和經(jīng)驗(yàn),雖然與高通和英偉達(dá)等大廠依然存在差距,但已不存在代差,且距離還在縮小。以CPU為例,中國大陸企業(yè)設(shè)計(jì)的產(chǎn)品很難拿到臺(tái)積電7nm及更先進(jìn)制程產(chǎn)能,目前,中國本土量產(chǎn)CPU能獲得的最先進(jìn)制程工藝是12nm,在這種情況下,以設(shè)計(jì)能力提升CPU性能見長的企業(yè)就凸顯了出來,如龍芯,即便被美國列入實(shí)體清單,無法拿到相關(guān)產(chǎn)業(yè)資源,其CPU依然能夠迭代前行,且性能在不斷提升。
芯片制造方面,任務(wù)最為艱巨,在目前的國際供應(yīng)鏈發(fā)展態(tài)勢下,要想制造出高水準(zhǔn)的芯片,不僅要提升晶圓廠的工藝水平,還需要相關(guān)設(shè)備廠的跟進(jìn),并要深度參與晶圓廠工藝產(chǎn)線建設(shè),此外,芯片設(shè)計(jì)與制造的融會(huì)貫通顯得尤為重要,這就是為什么我們不能放棄發(fā)展中國本土IDM的一個(gè)重要原因。只有做好以上工作,才能實(shí)現(xiàn)過去幾年經(jīng)常說的:用14nm制程工藝產(chǎn)線制造出相當(dāng)于7nm性能、功耗表現(xiàn)的芯片。
在芯片應(yīng)用和系統(tǒng)集成方面,特別是高性能計(jì)算數(shù)據(jù)中心和云端,在越來越難獲得國際大廠高端芯片的情況下,如何彌補(bǔ)因單一芯片算力不足而形成的系統(tǒng)性能缺失?前文提到了一些本土廠商的應(yīng)對(duì)策略,但那些方法大都很難持久,且不適合大規(guī)模應(yīng)用,必須在芯片層級(jí)有所突破才行。