在Gartner的《數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)平臺魔力象限》報(bào)告中,MathWorks連續(xù)兩年都被評為年度領(lǐng)導(dǎo)者。該報(bào)告主要針對全球有影響力的機(jī)器學(xué)習(xí)、人工智能平臺進(jìn)行評估,MathWorks 作為數(shù)學(xué)計(jì)算軟件開發(fā)商,主要有MATLAB 和Simulink兩大類產(chǎn)品平臺。MATLAB 被稱為“科學(xué)家和工程師的語言”,是一個(gè)集算法開發(fā)、數(shù)據(jù)分析、可視化和數(shù)值計(jì)算于一體的編程環(huán)境;Simulink 則是一個(gè)模塊化建模環(huán)境,面向多域和嵌入式工程系統(tǒng)的仿真和基于模型的設(shè)計(jì)。目前,這兩類產(chǎn)品平臺被廣泛用于軍工、航空、航天、半導(dǎo)體等20幾個(gè)行業(yè),用于人工智能、大數(shù)據(jù)處理、仿真設(shè)計(jì)等工作。
作為全球領(lǐng)先的數(shù)學(xué)計(jì)算軟件開發(fā)商,2020年起每年追蹤并發(fā)布全球人工智能發(fā)展趨勢,已經(jīng)成為MathWorks的慣例。日前,MathWorks最新發(fā)布了對2022年以后的十大人工智能趨勢預(yù)測,MathWorks中國區(qū)行業(yè)市場經(jīng)理李靖遠(yuǎn)(Jason)接受了<與非網(wǎng)>等媒體采訪。
趨勢一:人工智能在工程和科學(xué)學(xué)科、整個(gè)行業(yè)和學(xué)術(shù)界廣泛普及
盡管落地應(yīng)用、發(fā)展現(xiàn)狀有一定區(qū)別,但人工智能確實(shí)已經(jīng)在很多行業(yè)蓬勃發(fā)展。在智能家居、自動(dòng)駕駛、機(jī)器人、網(wǎng)絡(luò)安全、醫(yī)療設(shè)備等新興行業(yè)中,得益于良好的數(shù)字化技術(shù)基礎(chǔ),人工智能的發(fā)展和落地較為領(lǐng)先。在數(shù)字化基礎(chǔ)相對落后一些的傳統(tǒng)行業(yè),例如電力、化工等領(lǐng)域,人工智能、大數(shù)據(jù)、數(shù)字化的普及與轉(zhuǎn)型可以說正處在起步階段,還需要大量的數(shù)字化積累。
趨勢二:AI將工程、計(jì)算機(jī)科學(xué)、數(shù)據(jù)科學(xué)和IT部署整合起來
人工智能可以將工程、計(jì)算科學(xué)、數(shù)字科學(xué)和IT部署聯(lián)合起來,而之前這些是彼此相對獨(dú)立的。包括傳統(tǒng)意義所指的開發(fā)流程、部署流程和企業(yè)運(yùn)營流程,它們將通過人工智能、無代碼、低代碼等趨勢緊密結(jié)合在一起,形成有機(jī)整體。低代碼、無代碼的工具在進(jìn)行建模仿真之后,可以自動(dòng)地生成代碼,然后再部署到CPU/MCU/GPU/FPGA等多種類型的邊緣設(shè)備之上。
趨勢三:模型可解釋性有助于增強(qiáng)在安全關(guān)鍵系統(tǒng)中使用人工智能的信心
在航空航天、軍工等安全關(guān)鍵領(lǐng)域中,對于機(jī)械模型設(shè)計(jì)、虛擬仿真技術(shù)的要求,是所涉及到的模型必須具備清晰的可解釋性,才會(huì)導(dǎo)入應(yīng)用。但一直以來,人工智能通過機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等算法生成的模型,在可解釋性方面不如直接建模清晰,被視作一種黑盒式的系統(tǒng)建模方法。隨著人工智能的發(fā)展,模型的可解釋性也在不斷提高,也將在更多的注重高安全的關(guān)鍵領(lǐng)域得以應(yīng)用。
趨勢四:仿真和測試將邁入三維時(shí)代且更加逼真
仿真和測試不只是局限于自動(dòng)駕駛、機(jī)器人、虛擬現(xiàn)實(shí)等環(huán)節(jié),甚至醫(yī)療行業(yè)等應(yīng)用場景中,人工智能會(huì)推動(dòng)更多的3D仿真和測試技術(shù)的應(yīng)用,使得場景更加真實(shí)、可靠、具體。
趨勢五:將有更多的AI模型部署到更多低功耗、低成本的嵌入式設(shè)備中
將有更多的人工智能模型部署到更低功耗、更低成本的系統(tǒng)設(shè)備中。日常生活中,大到飛機(jī)、汽車,小到家用電器,都內(nèi)置著大量的嵌入式系統(tǒng)。在2014年前后,大部分的人工智能算法都需要基于GPU甚至GPU集群進(jìn)行訓(xùn)練,受限于硬件算力,之前部署到這些設(shè)備上較為困難。但是隨著越來越多的方法可以將AI整合到更多邊緣系統(tǒng),從FPGA到MCU,更多低成本、低功耗設(shè)備得到了廣泛的硬件支持,并為工程師所用。
借助量化和剪枝等方法減小要部署的模型,并采用深度學(xué)習(xí)社區(qū)提供的高效預(yù)訓(xùn)練模型,可以實(shí)現(xiàn)AI的高效部署,并能夠讓基于AI的系統(tǒng)在今后得到更為廣泛的應(yīng)用。
趨勢六:人工智能幫助應(yīng)對全球挑戰(zhàn)
不論是傳染病大流行還是氣候變化,還有能源問題、包括碳中和方向,人工智能都在幫助人類應(yīng)對全球挑戰(zhàn)。越來越多的科學(xué)家在使用MATLAB數(shù)據(jù)處理和AI算法分析新冠病毒的流行趨勢,對大氣進(jìn)行長期的空氣質(zhì)量監(jiān)測,利用數(shù)據(jù)分析大氣的氣候變化等等。
趨勢七:以數(shù)據(jù)為中心的人工智能
以往的很多人工智能應(yīng)用專注于模型和算法本身,但從2019年開始,相關(guān)研究方向開始專注于改善提供給模型和數(shù)據(jù)管理系統(tǒng)的數(shù)據(jù),也就是說要給予模型更好更優(yōu)的算法、更優(yōu)的數(shù)據(jù),數(shù)據(jù)的優(yōu)化代表著能產(chǎn)生更優(yōu)秀的模型。
趨勢八:無代碼/低代碼/自動(dòng)編碼:為擴(kuò)大AI用戶群體帶來巨大好處
無代碼、低代碼和自動(dòng)編碼等應(yīng)用,為AI的普及帶來助推力。傳統(tǒng)的行業(yè)領(lǐng)域有很多專家,不過他們的經(jīng)驗(yàn)往往集中于自己的垂直領(lǐng)域。如何讓他們快速將人工智能算法與自身擅長的領(lǐng)域相結(jié)合?無代碼和低代碼就起到了關(guān)鍵作用,利用MathWorks所提供的深度學(xué)習(xí)、機(jī)器學(xué)習(xí),包括強(qiáng)化學(xué)習(xí)工具箱,專家們就算并不擅長編程,也能很快地掌握無代碼/低代碼的人工智能學(xué)習(xí)方案。
趨勢九:AI驅(qū)動(dòng)跨框架、跨平臺和多學(xué)科團(tuán)隊(duì)之間的協(xié)作
目前AI框架類型較多,比如Tensorflow、PyTorch、Keras、Caffe等,這些框架各自專注的領(lǐng)域往往不同,沒有任何一個(gè)框架可以解決所有問題,因此跨框架的協(xié)同和互操作非常重要。MathWorks通過以MATLAB/Simulink為基礎(chǔ)平臺,將其他框架中的算法導(dǎo)入MATLAB/Simulink中,使之成為整個(gè)大系統(tǒng)仿真的一部分,以此來促進(jìn)不同學(xué)科之間的交流,以及整個(gè)平臺系統(tǒng)級的仿真。
趨勢十:人工智能大量用于應(yīng)用科學(xué)研究
從人工智能的發(fā)展趨勢來看,應(yīng)用學(xué)科越來越成為新的熱點(diǎn)應(yīng)用。例如遷移學(xué)習(xí)使研究人員更容易在工作中應(yīng)用人工智能,他們只需在實(shí)際應(yīng)用中對訓(xùn)練好的模型進(jìn)行一定幅度的微調(diào),就可以快速地部署在實(shí)際場景中。此外,研究人員利用GAN等技術(shù)生成對抗網(wǎng)絡(luò),以及通過PIML促進(jìn)機(jī)器學(xué)習(xí)和物理知識的融合等,都是新技術(shù)在應(yīng)用學(xué)科研究方向的案例。
MathWorks在企業(yè)人工智能工程領(lǐng)域的進(jìn)展?
海量大中小型企業(yè)是人工智能應(yīng)用的積極實(shí)踐者,特別是對于那些具有一定規(guī)模和行業(yè)地位的企業(yè),已經(jīng)走在了應(yīng)用前列。顯然,針對這些用戶的工具、服務(wù)等,都非常重要。
在MathWorks官網(wǎng)上,僅使用MATLAB AI解決工程問題的案例就超過了100個(gè)。MathWorks提供的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)工具箱,也已經(jīng)滲透到各類企業(yè)行業(yè)應(yīng)用的方方面面,例如日本Daihatsu公司分析汽車發(fā)動(dòng)機(jī)產(chǎn)生爆震的原因;三星公司研究降低無線通信電路的噪音;韓國能源研究所對風(fēng)機(jī),尤其是海上風(fēng)機(jī)進(jìn)行故障監(jiān)測……
針對企業(yè)級部署需求,MathWorks在開發(fā)側(cè)推出了MATLAB Production Server和Web App Server,配合海量數(shù)據(jù)處理、無代碼/低代碼建模系統(tǒng)軟件、自動(dòng)化代碼生成,能夠幫助運(yùn)維人員將算法快速部署在企業(yè)IT/OT系統(tǒng)中,做到開發(fā)和運(yùn)營一體化部署。
對于現(xiàn)階段的AI應(yīng)用來說,數(shù)據(jù)仍是重中之重。除了數(shù)據(jù)的獲取,對不同數(shù)據(jù)類型的分類、標(biāo)注,對于下一階段的處理應(yīng)用非常關(guān)鍵。如果能夠自動(dòng)為數(shù)據(jù)標(biāo)注標(biāo)簽,之后再對其進(jìn)行訓(xùn)練、調(diào)優(yōu)以及可視化,不僅能夠提高工作效率,對于更精準(zhǔn)的訓(xùn)練、應(yīng)用都大有裨益。
MathWorks在這方面提供了完整的AI工具鏈,除了“打標(biāo)簽”,還包括對采集到的數(shù)據(jù)進(jìn)行預(yù)處理,例如通過算法擬合補(bǔ)充丟失的數(shù)據(jù),過濾“臟”數(shù)據(jù)等等,之后再進(jìn)行人工智能的建模、仿真、測試和部署。據(jù)李靖遠(yuǎn)介紹,企業(yè)級AI應(yīng)用比較復(fù)雜,因此跨平臺、跨框架的支持必不可少,為了方便在各個(gè)平臺中互相調(diào)用,增強(qiáng)互操作性。MATLAB還針對幾種主流框架提供了導(dǎo)入器工具,Tensorflow、Keras、 Caffe、Pytorch等框架中的模型可以通過導(dǎo)入器自動(dòng)進(jìn)入MATLAB中,形成系統(tǒng)級仿真。
降階模型和邊緣AI趨勢
李靖遠(yuǎn)強(qiáng)調(diào)了一個(gè)重要趨勢:今后將使用一些降階模型去替代高保真仿真模型,來加速仿真速度。由于很多非線性系統(tǒng),包括流體力學(xué)中的多維系統(tǒng),在實(shí)際仿真過程中需要的并不是高保真仿真模型,而是整個(gè)系統(tǒng)模型的輸入、輸出要盡量接近真實(shí)。此時(shí),就可以用降階模型作為系統(tǒng)的一部分來加快仿真速度。
不過,目前一些降階技術(shù)還是需要結(jié)合具體的系統(tǒng)來實(shí)現(xiàn)最適合的方案,并不是對所有系統(tǒng)都具備普適性。據(jù)李靖遠(yuǎn)介紹,目前降階模型的主要適用場景:一是針對非線性模型,傳統(tǒng)意義上很難找到其中的規(guī)律,就可以用人工智能訓(xùn)練出來的降階模型來替代它;二是在仿真過程中,理想模型與降階模型的吻合度相對比較高,就可以用降階模型替代實(shí)際模型進(jìn)行仿真。當(dāng)然,這主要是為了提高仿真速度,在仿真效果和仿真速度之間取得的折中平衡,并不適用于所有系統(tǒng)。如果追求高保真的仿真效果,降階模型是不適用的。
針對邊緣AI的應(yīng)用趨勢,李靖遠(yuǎn)表示,現(xiàn)實(shí)中有龐大的邊緣系統(tǒng)需求,涉及航空航天、汽車、工業(yè)、通信、家電、醫(yī)療、能源、可穿戴設(shè)備、手機(jī)、電子手表等等,邊緣AI未來的需求一定是巨大的。
但與此同時(shí),邊緣AI的落地部署仍有三大制約因素:第一是硬件效率的制約,受限于硬件算力、算法效率等原因,一些比較復(fù)雜的算法還是不太適合部署在邊緣設(shè)備上。第二是AI算法代碼的精煉度,AI算法生成模型,最后代碼是要部署在邊緣設(shè)備上,代碼的精煉度可能對邊緣設(shè)備的部署有一定影響。第三是AI的產(chǎn)品化,AI算法如何能夠適用于更多的通用場景、部署在更多的邊緣設(shè)備,也是一個(gè)制約因素。要提高通用性,勢必要增加代碼,對算力的要求會(huì)更高,因此會(huì)對部署產(chǎn)生一定的制約。