半導(dǎo)體行業(yè)正面臨一個巨大的轉(zhuǎn)折點,以語言大模型為代表的人工智能技術(shù)的質(zhì)變,讓整個世界處于計算范式轉(zhuǎn)折的前夜,并行計算即將成為主流,半導(dǎo)體行業(yè)被裹挾其中。哲庫的飲恨離場,不過是芯片產(chǎn)業(yè)風(fēng)云巨變的開場。
上個月底,阿里云宣布了“史上最大規(guī)模降價”,其中核心產(chǎn)品價格全線下調(diào)15%-50%,存儲產(chǎn)品最高降價50%。對于云服務(wù)廠商來說,支撐起高效和高性價比服務(wù)的,是硬件和云計算能力的雙重優(yōu)勢。云計算也是大模型軍備競賽的技術(shù)支撐,ChatGPT就是鮮活案例。
ChatGPT能真正實現(xiàn)大規(guī)模應(yīng)用,背后少不了微軟的支持。微軟云OpenAI是ChatGPT的獨家云供應(yīng)商,ChatGPT大模型訓(xùn)練所需要的海量數(shù)據(jù),也來自微軟云多年的積累。正如李彥宏所言,“之前企業(yè)選擇云廠商更多看算力、存儲等基礎(chǔ)云服務(wù)。未來,更多會看框架好不好、模型好不好,以及模型、框架、芯片、應(yīng)用這四層之間的協(xié)同?!?/p>
阿里云宣布要上市,為什么是現(xiàn)在?因為人工智能時代,以GPU、TPU為代表的異構(gòu)計算芯片,將成為智能化基礎(chǔ)設(shè)施。阿里云如果不能主動折舊(降價),融資(上市即加杠桿)擁抱新的基礎(chǔ)設(shè)施架構(gòu),可能會錯過下一波而被邊緣化。
縱觀全球計算主芯片,異構(gòu)已經(jīng)不是一個未來潮流,而是現(xiàn)實落地的主流和頂流。
蘋果新一代SOC芯片產(chǎn)品,M2 Pro 和 M2 Max,大幅集成GPU功能。M2 Pro芯片提升M2 芯片原有架構(gòu),帶來多達(dá)12核的中央處理器和多達(dá)19核的圖形處理器,M2 Max芯片在 M2 Pro的強大性能基礎(chǔ)上更進(jìn)一步,帶來多達(dá)38核的圖形處理器。兩款芯片還有增強的定制技術(shù)加持,包括速度更快的16核神經(jīng)網(wǎng)絡(luò)引擎,每秒可進(jìn)行最多達(dá) 15.8 萬億次運算,較前代芯片快達(dá)40%。
Intel一直在為其異構(gòu)架構(gòu)理念不停地做重磅收購,2015年收購FPGA供應(yīng)商Altera,2016年收購AI芯片供應(yīng)商Nervana,2017年收購了ADAS芯片供應(yīng)商Mobileye和AI芯片供應(yīng)商Movidius,2018年收購eASIC,2019年收購云端AI芯片供應(yīng)商Habana Labs。
AMD收購Xilinx后,Zynq異構(gòu)系列的戰(zhàn)略不用多說,傳言AMD與微軟合作,合作開發(fā)一款代號為雅典娜(Athena)的自主研發(fā)的人工智能芯片。
谷歌張量處理器(tensor processing unit,TPU)是該公司為機器學(xué)習(xí)定制的專用芯片(ASIC),第一代發(fā)布于2016年,成為了AlphaGo背后的算力。與GPU相比,TPU采用低精度計算,在幾乎不影響深度學(xué)習(xí)處理效果的前提下大幅降低了功耗、加快運算速度。同時,TPU使用了脈動陣列等設(shè)計來優(yōu)化矩陣乘法與卷積運算。
如今TPU已經(jīng)發(fā)展到了第四代,雖然每個TPU的處理速度都比不上最好的英偉達(dá)AI芯片,但谷歌用于連接芯片和在芯片之間傳遞數(shù)據(jù)的光電路交換技術(shù)彌補了性能差異。
其他互聯(lián)網(wǎng)公司也有自研芯片的,但基本上都是基于ARM架構(gòu),比如亞馬遜的推理芯片Inferentia和訓(xùn)練芯片Trainium,還有META昨天剛剛發(fā)布的AI加速器芯片MTIA(Meta訓(xùn)練和推理加速器)。
AI風(fēng)潮之下,沒有什么領(lǐng)域不會被波及,AI深入到邊緣和終端裝置,已經(jīng)是一個長期必然的大方向,我相信MCU也不會例外。
隨著物聯(lián)網(wǎng)設(shè)備的普及和應(yīng)用場景的擴大,對于更智能化和自主決策能力的需求也在增加,作為物聯(lián)網(wǎng)設(shè)備中必不可少的大腦——MCU,正朝著更智能化、更強大的方向發(fā)展。
傳統(tǒng)認(rèn)知中,人工智能(AI)相關(guān)的深度學(xué)習(xí)應(yīng)用,只有算力充沛的MPU或者是PC才能玩得轉(zhuǎn),MCU作為邊緣物聯(lián)網(wǎng)的主控芯片,其在AI中擔(dān)任的主要功能是推理和決策。
將AI能力集成到MCU上,使得AI算法可以實時地在設(shè)備本地進(jìn)行處理和響應(yīng),而無需依賴于云端或其他遠(yuǎn)程服務(wù)器。這提高了系統(tǒng)的實時性和即時響應(yīng)能力,使得設(shè)備能夠更快速地做出決策和反應(yīng),且可以在低功耗的情況下實現(xiàn)高效的AI計算。
現(xiàn)在為邊緣設(shè)備創(chuàng)建機器學(xué)習(xí)模型正成為一種大的趨勢,這些模型稱為微型機器學(xué)習(xí)或TinyML,它主要適用于內(nèi)存和處理能力有限的設(shè)備,以及互聯(lián)網(wǎng)連接不存在或有限的設(shè)備。TinyML使在MCU上運行深度學(xué)習(xí)模型成為可能。TinyML在MCU上的應(yīng)用越來越普遍。
各大MCU巨頭其實很早就已開始布局。
恩智浦:2018年推出了機器學(xué)習(xí)軟件eIQ軟件,該軟件能夠在恩智浦EdgeVerse微控制器和微處理器(包括i.MX RT跨界MCU和i.MX系列應(yīng)用處理器)上使用。并推出了AI工具鏈NANO.AI。最近恩智浦推出了MCX N系列,MCX N94x和MCX N54x MCU系列中集成了恩智浦設(shè)計的用于實時推理的專用片上神經(jīng)處理單元 (NPU)。據(jù)悉,與單獨使用CPU內(nèi)核相比,片上NPU的ML吞吐量最高可提高30倍。
ST:2021年6月3日,意法半導(dǎo)體宣布收購邊緣AI軟件專業(yè)開發(fā)公司Cartesiam。Cartesiam成立于2016年,總部位于法國土倫,專門從事人工智能開發(fā)工具研發(fā),讓基于Arm的MCU具有機器學(xué)習(xí)和推理能力。ST即將推出第一個帶有神經(jīng)網(wǎng)絡(luò)硬件處理單元(Neural-Art Accelerator)的通用微控制器——STM32N6,這款MCU與其STM32MP1微處理器(運行頻率為 800MHz 的雙 Cortex-A7)相比,STM32N6 的推斷速度提高了25倍。
瑞薩:去年瑞薩收購了Reality AI,主要為汽車、工業(yè)和商業(yè)產(chǎn)品中的高級非視覺傳感提供范圍廣泛的嵌入式人工智能和微型機器學(xué)習(xí) (TinyML) 解決方案。
英飛凌:2023年5月16日,英飛凌宣布,已收購總部位于瑞典斯德哥爾摩的初創(chuàng)公司Imagimob AB。Imagimob是快速增長的微型機器學(xué)習(xí)和自動機器學(xué)習(xí)(TinyML 和 AutoML)市場的領(lǐng)先者。以提升其微控制器和傳感器上的TinyML邊緣 AI 功能。
國內(nèi)MCU廠商大部分仍處于模仿兼容傳統(tǒng)STM32的同質(zhì)化水平,忙于內(nèi)卷比拼價格,生存還是個問題,基本上還顧不上未來的布局。
我司作為MCU的新進(jìn)廠商,由于客戶需求與STM32兼容,但是在其中贈送了FPGA的異構(gòu)邏輯,F(xiàn)PGA本身就可以用于并行加速用,其核心架構(gòu)與TPU的脈動陣列矩陣運算有異曲同工的相似之處。我們下一代產(chǎn)品中擴大邏輯容量后將可直接與TinyML的邊緣推理整合。
我們正在邁入AIoT時代,AI深入到邊緣和終端裝置,已經(jīng)是一個長期必然的大方向。做好技術(shù)準(zhǔn)備,國產(chǎn)廠商方能迎接未來轉(zhuǎn)折窗口的挑戰(zhàn)。