AI正以出乎意料的速度在云邊端全面突破。
如果說(shuō)上一波AI應(yīng)用主要集中在云端和碎片化的終端市場(chǎng),那么這一波邊緣AI、嵌入式AI的增長(zhǎng),正是AI逐漸走向普適化的標(biāo)志之一。
以往人們所熟知的AI運(yùn)算平臺(tái)主要是CPU、GPU、FPGA、NPU或?qū)S玫腁I處理芯片,但是在新一輪賽程中,邊緣和端側(cè)MCU、傳感器導(dǎo)入AI的速度明顯在加快,有望成為AI落地的新動(dòng)力。
上一波AI的爆發(fā)式增長(zhǎng),造就了英偉達(dá)的地位,催生了大大小小的AI芯片公司,而在新一輪的“接力”賽程中,傳統(tǒng)的芯片巨頭TI、ST、恩智浦、瑞薩等,正全面站上賽道。
恩智浦首推MCX:兼具控制和AI處理功能
“我們正在進(jìn)入邊緣計(jì)算新時(shí)代,這要求我們從根本上重新思考如何以合理方式構(gòu)建靈活的MCU產(chǎn)品組合,該產(chǎn)品組合應(yīng)具有擴(kuò)展性、經(jīng)過(guò)優(yōu)化,并且能夠成為當(dāng)今以及未來(lái)幾十年節(jié)能工業(yè)和物聯(lián)網(wǎng)邊緣應(yīng)用的基礎(chǔ)”,恩智浦執(zhí)行副總裁兼邊緣處理技術(shù)總經(jīng)理Ron Martino表示。
從恩智浦(NXP)最新發(fā)布的MCX微控制器產(chǎn)品組合來(lái)看,首次集成了用于加快邊緣推理的神經(jīng)處理單元(NPU),與單獨(dú)的CPU內(nèi)核相比,可提供高達(dá)30倍的機(jī)器學(xué)習(xí)吞吐量。MCX基于恩智浦誕生于2007年的LPC系列和當(dāng)時(shí)的飛思卡爾在2010年推出的Kinetis系列,可以說(shuō)是傳承了兩大系列的核心優(yōu)勢(shì)。
恩智浦邊緣處理事業(yè)部系統(tǒng)工程高級(jí)總監(jiān)王朋朋認(rèn)為,在MCU中集成神經(jīng)處理單元,可以說(shuō)是迎合時(shí)代需求。在CPU旁邊增加的NPU協(xié)處理器,內(nèi)部擁有計(jì)算通道,可以實(shí)現(xiàn)良好的計(jì)算性能和能效。在NPU上進(jìn)行機(jī)器學(xué)習(xí)運(yùn)算加速時(shí),比如二維卷積神經(jīng)網(wǎng)絡(luò)、點(diǎn)卷積或深度卷積,性能會(huì)比Cortex-M33內(nèi)核加速30倍以上。
以往運(yùn)用CPU處理的事項(xiàng),例如機(jī)器學(xué)習(xí)的卷積處理現(xiàn)在可以由NPU來(lái)完成,而不占用CPU資源。通過(guò)CPU和NPU的并行處理,可同時(shí)做到控制和外界的交互,因此,AI處理和通用的輸入輸出控制可以并行實(shí)現(xiàn)。從而在一顆通用MCU上,既實(shí)現(xiàn)了傳統(tǒng)MCU功能,也實(shí)現(xiàn)了AI運(yùn)算加速。
恩智浦大中華區(qū)工業(yè)與物聯(lián)網(wǎng)市場(chǎng)高級(jí)總監(jiān)金宇杰表示,隨著人工智能和智能邊緣計(jì)算的發(fā)展,業(yè)界所面臨的挑戰(zhàn)也越來(lái)越多:第一,技術(shù)格局在快速發(fā)展;第二,隨著數(shù)據(jù)的大量傳輸、運(yùn)算和處理,對(duì)信息安全保護(hù)的需求也越來(lái)越重要;第三,手持設(shè)備、電池應(yīng)用等領(lǐng)域?qū)?a class="article-link" target="_blank" href="/tag/%E4%BD%8E%E5%8A%9F%E8%80%97/">低功耗的要求也越來(lái)越嚴(yán)苛。MCU傳統(tǒng)上雖然是做控制工作,但隨著產(chǎn)品對(duì)智能運(yùn)算、可預(yù)見性的要求越來(lái)越多,對(duì)運(yùn)算的要求也大大提升。因此在MCU中嵌入算力更強(qiáng)的AI元素,希望通過(guò)NPU高效的計(jì)算架構(gòu),實(shí)現(xiàn)實(shí)時(shí)推理。
ST在MCU和傳感器加速導(dǎo)入AI
ST約在三年前開始將輕量的AI算法融入MCU中,作為對(duì)已有產(chǎn)品系列的補(bǔ)充和增強(qiáng)。驅(qū)使ST開始推行這一路線的主要原因是邊緣計(jì)算,因?yàn)殡S著5G的到來(lái),人們對(duì)傳統(tǒng)產(chǎn)品的延遲和能耗提出了更高要求。
ST旗下經(jīng)典的STM32家族已經(jīng)誕生約15年,面向未來(lái),STM32確立了三大發(fā)展方向:更多無(wú)線通信技術(shù)、更先進(jìn)的安全保護(hù)、以及更高的本機(jī)自主智能。
為何導(dǎo)入AI?ST方面認(rèn)為,除了云端、服務(wù)器端的人工智能,未來(lái),一些聯(lián)網(wǎng)能力并不太強(qiáng)、算力并不太高的設(shè)備,也需要執(zhí)行一些并不太復(fù)雜的AI算法。比如通過(guò)噪聲去判斷電機(jī)本身運(yùn)行的狀況、或是其他通過(guò)判斷來(lái)監(jiān)測(cè)系統(tǒng)運(yùn)行的效率……類似這樣的應(yīng)用不需要聯(lián)網(wǎng)到云端來(lái)實(shí)現(xiàn)。
AI在MCU上實(shí)現(xiàn)的意義在于,可以將MCU低功耗、低成本、實(shí)時(shí)性、穩(wěn)定性、開發(fā)周期短、廣闊的市場(chǎng)覆蓋率等特性,與AI強(qiáng)大的處理能力相結(jié)合,從而使海量終端智能涌現(xiàn)出來(lái)。
在AIoT系統(tǒng)中,還有一個(gè)非常關(guān)鍵的部分就是傳感器,傳感器的智能化也正在成為確定趨勢(shì)。以AR/VR應(yīng)用為例,之所以對(duì)傳感器有高需求,是因?yàn)檫@個(gè)產(chǎn)品直接連接人體,如果AV/VR在獲取周邊物理現(xiàn)象和信息的同時(shí),經(jīng)過(guò)智能處理再傳給主控,一來(lái)可以降低整體系統(tǒng)能耗,二來(lái)可以把本身的噪聲、穩(wěn)定性和精度做得更好。
ST最近發(fā)布的集成機(jī)器學(xué)習(xí)內(nèi)核的車規(guī)級(jí)慣性測(cè)量單元(IMU)ASM330LHHX,就是從智能駕駛向高度自動(dòng)化駕駛的又一步推進(jìn)。據(jù)ST官方信息,內(nèi)嵌的機(jī)器學(xué)習(xí)內(nèi)核是一個(gè)用電路連接的硬連線處理引擎,能直接在傳感器上運(yùn)行AI算法,確保從感測(cè)事件到車輛響應(yīng)的時(shí)間延遲很短,可以實(shí)現(xiàn)復(fù)雜的實(shí)時(shí)性能,而對(duì)系統(tǒng)功耗和算力的要求遠(yuǎn)低于嵌入在應(yīng)用處理器或基于云的人工智能解決方案,這對(duì)整體系統(tǒng)設(shè)計(jì)理念也是一次較大的突破。
與傳統(tǒng)傳感器僅采集數(shù)據(jù)、傳送給主控的特性相比,導(dǎo)入AI的傳感器可以在采集到原始數(shù)據(jù)后,通過(guò)機(jī)器學(xué)習(xí)讓模型進(jìn)行學(xué)習(xí),再將學(xué)習(xí)后判斷的依據(jù)寫入傳感器。因此,傳感器可以通過(guò)內(nèi)置的固定狀態(tài)機(jī)進(jìn)行判斷,一些特定任務(wù)可以考慮在本體上運(yùn)作,而不需要調(diào)動(dòng)整個(gè)處理器工作。
此外,隨著未來(lái)系統(tǒng)功能的豐富,各項(xiàng)任務(wù)指標(biāo)進(jìn)一步追求極限的話,延時(shí)仍是一個(gè)關(guān)鍵因素。除了設(shè)備本身的算力,傳輸時(shí)間可能也是主要原因。例如,傳1M的原始數(shù)據(jù)與1K的結(jié)果數(shù)據(jù)所需時(shí)間肯定不同,這可能也是推動(dòng)傳感器內(nèi)置AI的一大動(dòng)力。
TI針對(duì)細(xì)分市場(chǎng)引入AI
德州儀器(TI)約在2020年初,首次為一款汽車SoC添加了專用的深度學(xué)習(xí)加速器,這一方面說(shuō)明了深度學(xué)習(xí)在汽車ADAS系統(tǒng)中的深入,同時(shí)也可以看出TI在重要的車用產(chǎn)品線的布局方向。
TI這一深度學(xué)習(xí)模塊主要基于C7x DSP IP及其內(nèi)部開發(fā)的矩陣乘法加速器,通過(guò)將DSP和EVE內(nèi)核結(jié)合到一起,并添加了矢量浮點(diǎn)計(jì)算功能,支持向后兼容代碼。
TI這一做法也是當(dāng)時(shí)在邊緣/端側(cè)應(yīng)用中實(shí)現(xiàn)人工智能加速時(shí)較為流行的做法,將DSP專用于大量數(shù)據(jù)處理,在高難度的實(shí)時(shí)環(huán)境中執(zhí)行復(fù)雜的數(shù)學(xué)運(yùn)算。通過(guò)DSP的數(shù)據(jù)流功能與矩陣乘法加速器相結(jié)合,提升深度學(xué)習(xí)應(yīng)用的效率。
除了汽車市場(chǎng),TI近期針對(duì)邊緣AI的人機(jī)界面 (HMI) 交互應(yīng)用推出了新系列SoC,主打低功耗設(shè)計(jì),全新的Sitara AM62 處理器可支持雙屏顯示和小型人機(jī)界面應(yīng)用。
據(jù)TI官方資料,下一代 HMI 將帶來(lái)與機(jī)器交互的全新方式,例如在嘈雜的工廠環(huán)境中通過(guò)手勢(shì)識(shí)別來(lái)發(fā)出命令,或通過(guò)無(wú)線連接的手機(jī)或平板電腦來(lái)控制機(jī)器。將邊緣 AI 功能添加到 HMI 應(yīng)用(包括機(jī)器視覺、分析和預(yù)測(cè)性維護(hù)),則有助于賦予 HMI 全新的意義,而不是僅限于實(shí)現(xiàn)人機(jī)交互的界面。
從硬件角度來(lái)看,AM62 系列圍繞 64 位、1.4 GHz 四核 Arm Cortex A53 處理器子系統(tǒng)構(gòu)建,每個(gè)內(nèi)核由 32 KB 的 L1 DCache 和 512 KB 的共享 L2 緩存支持。這款處理器與用于通用用途的 400 MHz 單核 Arm Cortex-M4F MCU、專用 3D 圖形引擎以及用于設(shè)備資源和低功耗管理應(yīng)用的 R5F 內(nèi)核相匹配。AM62 系列還有一個(gè)專用的顯示子系統(tǒng),該子系統(tǒng)具有雙顯示支持,允許用戶將他們的邊緣 AI 和HMI 控制放在同一個(gè)硬件上。
讓日常消費(fèi)者更容易應(yīng)用AI,對(duì)于能否在邊緣大規(guī)模推進(jìn)AI部署非常重要。TI這一新突破,使得支持未來(lái) HMI 應(yīng)用程序的 AI/ML 可以存在于設(shè)備本身中,從而為用戶提供更低的延遲、更快的響應(yīng)時(shí)間和更自然直觀的體驗(yàn)。
瑞薩收購(gòu),加注嵌入式AI
瑞薩的MCU產(chǎn)品有著非常全面的產(chǎn)品布局,特別在工業(yè)和物聯(lián)網(wǎng)是其優(yōu)勢(shì)領(lǐng)域。隨著AIoT應(yīng)用的興起,瑞薩MCU產(chǎn)品在不斷創(chuàng)新,同時(shí)投入也在不斷加大。
近年來(lái)推出的嵌入式AI技術(shù)“e-AI”,可作為一個(gè)附加單元添加到設(shè)備上,通過(guò)預(yù)先學(xué)習(xí)好的AI處理模型,實(shí)現(xiàn)從傳感器數(shù)據(jù)收集到數(shù)據(jù)處理、分析和評(píng)估/判斷的全過(guò)程。
瑞薩最近還宣布了在嵌入式AI領(lǐng)域的一筆收購(gòu)。根據(jù)公開消息,瑞薩已與Reality AI達(dá)成最終協(xié)議,以全現(xiàn)金交易方式收購(gòu)這家嵌入式AI解決方案供應(yīng)商。據(jù)悉,該交易已獲得兩家公司董事會(huì)一致批準(zhǔn),預(yù)計(jì)將于2022年年底完成。
Reality AI的解決方案為機(jī)器學(xué)習(xí)提供信號(hào)處理,提供快速、高效的機(jī)器學(xué)習(xí)推理,甚至可用于最小的MCU。該公司的旗艦產(chǎn)品Reality AI Tools是一個(gè)支持整個(gè)產(chǎn)品開發(fā)生命周期的軟件環(huán)境,提供非視覺傳感器數(shù)據(jù)的分析。該公司在工業(yè)異常檢測(cè)、使用AI傳感器的汽車聲音識(shí)別方面已有較好的案例。
兩家公司表示,將這些技術(shù)與瑞薩的MCU、MPU組合相結(jié)合,可以提供更好的AI推理和信號(hào)處理能力,將有助于開發(fā)人員將先進(jìn)的機(jī)器學(xué)習(xí)和信號(hào)處理應(yīng)用于復(fù)雜問題。收購(gòu)Reality AI,也將使瑞薩能夠從硬件和軟件角度提供全面和高度優(yōu)化的端側(cè)解決方案,在工業(yè)物聯(lián)網(wǎng)、消費(fèi)電子和汽車應(yīng)用中更好地實(shí)現(xiàn)端側(cè)智能。
瑞薩總裁兼首席執(zhí)行官柴田英利表示:“終端數(shù)據(jù)的重要性和需求正以前所未有的規(guī)模增長(zhǎng)。Reality AI的AI解決方案加入到我們現(xiàn)有的嵌入式AI投資組合中,將進(jìn)一步鞏固我們作為領(lǐng)先的AIoT解決方案提供商的地位?!?/p>
工業(yè)物聯(lián)網(wǎng)、汽車等領(lǐng)域的機(jī)器學(xué)習(xí)應(yīng)用正在迅速增長(zhǎng),嵌入式機(jī)器學(xué)習(xí)、信號(hào)處理、高性能處理器的需求有望逐漸增長(zhǎng)。一方面,用戶需要更完整的解決方案支持,另一方面,高度定制化也可能是這一領(lǐng)域的一大特色?;谶@些趨勢(shì),業(yè)界類似這樣的收購(gòu)可能還將持續(xù)發(fā)生。
寫在最后
AI下沉到邊緣、終端和嵌入式市場(chǎng),從芯片到軟件、系統(tǒng)、再到整體方案,都需要部署相應(yīng)的AI能力,這既是挑戰(zhàn),也是全新的機(jī)遇。據(jù)Gartner預(yù)測(cè),2025年至少會(huì)有75%的數(shù)據(jù)處理將會(huì)在云端或者數(shù)據(jù)中心之外的地方進(jìn)行。伴隨這一波數(shù)據(jù)機(jī)遇的來(lái)臨,傳統(tǒng)半導(dǎo)體巨頭加大AI投入是發(fā)展的必然。
那么,傳統(tǒng)半導(dǎo)體巨頭在MCU上跑AI,與業(yè)界方興未艾的AI專用芯片相比,究竟是升維還是降維競(jìng)爭(zhēng)?其實(shí)從應(yīng)用場(chǎng)景來(lái)看,雙方各有發(fā)展空間。專用AI芯片與場(chǎng)景的適配非常緊密,在某一個(gè)或某一類應(yīng)用場(chǎng)景中有計(jì)算優(yōu)勢(shì)。而通用MCU內(nèi)置AI,相當(dāng)于在廣泛的應(yīng)用基礎(chǔ)上增加了AI的功能,這也從一定程度上有助于解決AI當(dāng)前落地的一個(gè)痛點(diǎn),即如何將AI算法適配于更多的通用場(chǎng)景、部署在更多的邊緣設(shè)備。
此外,從發(fā)展的路徑來(lái)看,老牌半導(dǎo)體巨頭除了用AI提升差異化能力之外,其發(fā)展的核心更是進(jìn)一步強(qiáng)化生態(tài),來(lái)保持長(zhǎng)期的核心競(jìng)爭(zhēng)力。不同于初創(chuàng)AI芯片公司從零起步、大開大合的AI戰(zhàn)略,巨頭布局AI基本都是沿著已有的產(chǎn)品路徑去規(guī)劃,同時(shí)注重將AI體系與原有的生態(tài)進(jìn)行密切結(jié)合,這是其高筑的競(jìng)爭(zhēng)壁壘,也是處于追趕階段的國(guó)產(chǎn)芯片廠商所面臨的一大挑戰(zhàn)。