快樂的是AI將改寫一切,帶來機遇;痛的是AI演進的速度太快,模型和應用層出不窮。
在8月27日舉行的elexcon2024深圳國際電子展上,ARM VP, China GTM, loT&Embedded Line of Business Chloe Ma發(fā)表了關(guān)于《加速邊緣人工智能創(chuàng)新》的演講。
我們捕捉了以下關(guān)鍵信息:
AI在邊緣落地的速度驚人
ARM賦能邊緣AI的創(chuàng)新聚焦的三個方面:硬件、軟件和生態(tài)
不會止步:ARM Flexible Access
隨著ChatGPT的興起以及大模型和生成式AI(GenAI)的迅猛發(fā)展,大模型助力于千行百業(yè)的自動化轉(zhuǎn)型和新質(zhì)生產(chǎn)力的提升。
AI正以前所未有的速度改變著人們的生活和工作方式。從Netflix到TikTok(抖音),再到ChatGPT,用戶增長的速度不斷刷新紀錄。特別是ChatGPT僅用五天時間就達到百萬用戶,兩個月內(nèi)輕松突破億級大關(guān),這一壯舉充分展示了AI技術(shù)的巨大潛力和市場接受度。隨著AI模型和計算芯片技術(shù)的不斷突破,AI算力正迅速向邊緣設(shè)備滲透,為智能手機、PC以及自動駕駛、機器人等新型計算領(lǐng)域帶來革命性變化。
Chloe Ma表示,這種飛速發(fā)展的背后,是AI強大的技術(shù)支撐。AI模型和計算芯片技術(shù)的突破,以及對實時響應成本、用戶體驗以及安全隱私的訴求,都讓AI算力迅速地撲到了邊緣設(shè)備。
針對邊緣AI的發(fā)展,當前傳感器主要承擔信息采集任務,邊緣網(wǎng)關(guān)尚不支持AI大模型,但這一狀況正在迅速改變。隨著AI PC和IoT網(wǎng)關(guān)加載的算力不斷提升,邊緣AI已展現(xiàn)出巨大潛力。未來,傳感器將支持更多模態(tài),并具備簡單的智能數(shù)據(jù)分析能力,而復雜的數(shù)據(jù)分析和決策規(guī)劃將實現(xiàn)云、邊、端的協(xié)同調(diào)度,整體AI算力水平將顯著提升。
ARM作為全球領(lǐng)先的計算平臺提供商,正在積極賦能邊緣AI的創(chuàng)新。ARM在硬件、軟件和生態(tài)三個方面持續(xù)發(fā)力,推出了包括Cortex-m嵌入式處理器、Cortex-a應用處理器以及Ethos邊緣AI加速器在內(nèi)的多款產(chǎn)品,以滿足不同場景的AI算力需求。同時,ARM還加強了CPU的矢量或矩陣處理能力,并在軟件和工具鏈方面加大投資,以幫助開發(fā)者輕松釋放AI硬件的潛力。
?硬件創(chuàng)新:強化算力,保障安全
Chloe Ma強調(diào)了ARM在硬件領(lǐng)域的深厚積累。她指出,ARM的Cortex-m嵌入式處理器與Cortex-a應用處理器為邊緣AI提供了強大的算力支持。面對萬物互聯(lián)帶來的安全挑戰(zhàn),ARM推出了TrustZone等安全技術(shù),為敏感數(shù)據(jù)和操作提供了堅實的保護屏障。此外,針對AI推理需求的激增,ARM不僅增強了CPU的矢量與矩陣處理能力,還創(chuàng)新性地推出了Ethos邊緣系列AI加速器,進一步滿足了高性能、復雜AI工作負載的需求。
ARM的Ethos NPU是世界上首款的嵌入式AI加速器。目前已經(jīng)被英飛凌、恩智浦、Olive、奇景光電、Alif Semiconductor 和 Synaptics 等領(lǐng)先廠商的芯片所采用。從第一代的Ethos-U55到最新的U85,不僅在性能和能效上有顯著提升,而且還實現(xiàn)了對新的算子以及transformer等神經(jīng)網(wǎng)絡的原生支持。Ethos系列NPU提供了一致的工具,那么可以為邊緣AI生態(tài)帶來無縫的開發(fā)者體驗,使合作伙伴能夠重復利用在ARM AI上的投資。
?軟件與工具鏈:賦能開發(fā)者,優(yōu)化AI部署
在軟件與工具鏈方面,Chloe Ma介紹了ARM為開發(fā)者提供的全方位支持。從ARM虛擬硬件到IP Explorer,再到ML Influence Adviser、ML Zoo模型庫及ML Evaluation Kit等工具,ARM為開發(fā)者構(gòu)建了一個從設(shè)計到部署的高效流程。
同時,ARM還支持多種主流的ML開發(fā)框架,包括pywatch、ONMX 、TensorFlow 和 TensorFlow Lite以及中國本土的百度飛槳等,并針對不同硬件目標提供優(yōu)化的ML編譯器和runtime,確保ML模型在不同硬件上的最優(yōu)化運行。特別值得一提的是,ARM倡導的TOSA(tensor operator set architecture)開放標準正逐步簡化訓練環(huán)境到不同硬件平臺的部署過程,為AI技術(shù)的普及應用鋪平了道路。
近期ARM和meta進行合作,通過ExecuteTorch將PyTorch引入基于ARM架構(gòu)的邊緣側(cè)移動和嵌入式平臺。ARM與meta的合作就是依托于ARM在TOSA方面巨大的投入。
?生態(tài)構(gòu)建:加速芯片開發(fā),推動市場應用
在構(gòu)建開放生態(tài)方面,ARM致力于將豐富的處理器IP及系統(tǒng)IP實現(xiàn)預先集成和驗證,以Core Stone參考設(shè)計子系統(tǒng)的形式提供給合作伙伴。這些參考設(shè)計不僅縮短了開發(fā)周期,降低了開發(fā)成本,還助力合作伙伴快速推出符合市場需求的邊緣AI產(chǎn)品。同時,ARM還與英偉達合作,將Ethos NPU等創(chuàng)新技術(shù)應用于實際產(chǎn)品中,進一步推動了邊緣AI技術(shù)的商業(yè)化進程。
Chloe Ma表示,只有ARM才能提供從云到端,現(xiàn)代敏捷開發(fā)部署流程中所需要的特性和功能。使大家可以在基于量產(chǎn)驗證的一致架構(gòu)和統(tǒng)一的工具鏈上進行AI轉(zhuǎn)型。
在過去的一兩年大模型興起的過程中,ARM看到了整個業(yè)界的迅猛發(fā)展。業(yè)內(nèi)都處于一種“痛并快樂”的狀態(tài)中?!翱鞓贰钡氖茿I將改寫一切,帶來機遇。AI基本上會讓所有領(lǐng)域的芯片軟件都重組一遍。“痛的”是AI演進的速度太快,模型和應用層出不窮。對芯片設(shè)計公司來說,就是如何選賽道、定規(guī)格,加速產(chǎn)品的開發(fā)和上市,產(chǎn)生差異化。在這個AI的淘金潮中,ARM的計算平臺可以提供一套簡單易用并且通用的普世的利器。能夠把從云到端,非差異化的部件做好做精,讓大家用著順手,挖掘所發(fā)現(xiàn)的AI金礦。
為了讓廣大開發(fā)者更容易地訪問和使用ARM技術(shù),降低開發(fā)門檻,ARM在過去幾年中不斷探索創(chuàng)新的商務模式。Chloe Ma特別介紹了ARM Flexible Access(AFA)計劃,這一模式在海外已廣受好評,并在中國市場正式落地。AFA類似于Costco的會員制服務,開發(fā)者只需支付極低的年費,即可無限制地訪問ARM提供的豐富資源,包括Cortex-A、R、M系列CPU處理器、Ethos-U NPU、ML GPU和ISP參考設(shè)計,以及仿真平臺和工具鏈等。開發(fā)者可以根據(jù)自己的產(chǎn)品需求,自主選擇合適的IP組合進行設(shè)計和優(yōu)化,并在產(chǎn)品量產(chǎn)或流片時結(jié)算所選IP組合的授權(quán)及后續(xù)費用。這種靈活的商務模式極大地降低了開發(fā)成本,加速了產(chǎn)品上市進程,受到了包括樹莓派在內(nèi)的眾多開發(fā)者的熱烈歡迎。
最后,Chloe Ma總結(jié)到,人工智能的普及以及大模型和生成式AI的迅猛發(fā)展,為物聯(lián)網(wǎng)生態(tài)系統(tǒng)的合作伙伴們帶來了前所未有的機遇。ARM憑借其豐富的生態(tài)資源、領(lǐng)先的技術(shù)實力和廣泛的行業(yè)影響力,將全力支持合作伙伴把握邊緣AI的機遇,推動智能技術(shù)的廣泛應用。她堅信,只有云、邊、端三者緊密結(jié)合,才能構(gòu)建起無所不在的智能世界。
目前,全球約90%的AI運行在基于ARM架構(gòu)的CPU上,這一數(shù)字不僅彰顯了ARM在全球計算平臺中的領(lǐng)先地位,也預示著ARM將在未來繼續(xù)引領(lǐng)AI計算的潮流,與生態(tài)伙伴共同釋放AI前所未有的規(guī)模潛力。*聲明:本文系原作者創(chuàng)作。文章內(nèi)容系其個人觀點,我方轉(zhuǎn)載僅為分享與討論,不代表我方贊成或認同,如有異議,請聯(lián)系后臺。