加入星計劃,您可以享受以下權益:

  • 創(chuàng)作內容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
  • 相關推薦
  • 電子產業(yè)圖譜
申請入駐 產業(yè)圖譜

當人工智能遇上MATLAB,模型訓練簡單化

2018/05/29
30
閱讀需 21 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

人工智能在過去兩年被谷歌引爆,于是該領域的創(chuàng)業(yè)公司如雨后春筍般生長起來,有的做專用芯片,有的做算法,有的做機器人…人工智能到底是什么?是讓機器代替人類完成重復的生產線勞動嗎?這樣理解為免太簡單。人工智能絕對不只是讓機器完成模仿,從而替代重復性工作,真正的人工智能需要機器經過訓練和學習,接近或者超越人類的智能行為。

人工智能訓練模型的時候,數(shù)據(jù)是最重要的因素,只有通過大數(shù)據(jù)訓練,才能讓訓練的模型更接近于實際需求。比如,自動駕駛的模型訓練,現(xiàn)在基本是靠自動駕駛汽車上路測試收集數(shù)據(jù)訓練模型,路上的汽車只有采集到更多可能的場景,才能確保訓練出的模型更接近實際路況。在人工智能訓練中一般會遇到兩個問題:第一,數(shù)據(jù)量不夠如何訓練模型?第二,數(shù)據(jù)量太大如何快速進行標注?

MathWorks產品市場經理趙志宏

通過模型產生數(shù)據(jù)訓練神經網(wǎng)絡

如果沒有數(shù)據(jù)能做人工智能嗎?這是很多初創(chuàng)公司的困惑。在筆者的概念里,正常的 AI 開發(fā)流程是,先采集數(shù)據(jù),再訓練模型。在最近的 MathWorks EXPO 大會上,MathWorks 產品市場經理趙志宏先生給出了一個不一樣的答案,他表示,“數(shù)據(jù)、輸出和模型是整個 AI 開發(fā)流程的一個步驟。如果開發(fā)者想做人工智能,又無法獲取足夠的數(shù)據(jù),可以采用數(shù)字模型來產生數(shù)據(jù)。”比如:通過人工智能的方式來預測風力發(fā)電機的故障需要故障數(shù)據(jù),而采集風力發(fā)電機的故障數(shù)據(jù)需要大量的時間和成本,幾乎不現(xiàn)實。利用風力發(fā)電機在設計時已經建立好的 Simulink 模型,通過校正讓這個模型非常接近風力發(fā)電機實際運行情況,然后在模型中制造故障,就可以很容易地產生出想要的故障數(shù)據(jù),進而訓練機器學習或者深度學習的神經網(wǎng)絡。

趙志宏先生表示,“基于模型設計的優(yōu)勢是,它是在真正做出產品之前建好一個模型,這個模型與實際產品非常的接近,不管是從數(shù)字計算、行為計算產生的結果與真正的結果都非常接近。很多工程師在設計產品的時候已經把這個模型建好了,在這個模型上加入故障情況就很容易產生故障數(shù)據(jù),這比在實際設備上產生的故障要容易很多。因此,可以進行故障預測和維護?!?/p>

通過深度學習對大數(shù)據(jù)進行標注

隨著傳感器的大量采用,數(shù)據(jù)量進入洪荒時代,給人工智能進行特征標記帶來困難,這時候可以采用深度學習進行標記。趙志宏先生解釋,“深度學習的特點是不需要人工手動找出特征值,系統(tǒng)可以自動從數(shù)據(jù)里提取特征值。MATLAB 提供輔助自動標記的工具和功能。著名的汽車配件公司 AUTOLIV 就在 MATLAB 提供的功能上開發(fā)了 LiDAR 三維點云語義分割的算法來進行自動數(shù)據(jù)標注。它對 LiDAR 三維點云的每一點進行自動標注,把這個點聚類成一個目標模型,然后再把目標具體代表的實物辨別出來。”

以膨化食品智能檢測為例,研究人員可以在用戶咬食品的時候提取特征,用咬合聲音和咬合力度衡量食品的松脆度,有了這兩個特征,還需要開發(fā)一個機器學習的分類器,而 MATLAB 提供了分類學習器。開發(fā)者通過這個工具不需要一個一個去試各種分類器的算法,使用 MATLAB 提供的 APP 去一次性嘗試所有算法。開始運行 APP 后,用戶選好數(shù)據(jù)和需要訓練的分類器,然后進行訓練。在訓練過程中,用戶可以看到每個分類器的整體結果,選擇精確度最高的一個,然后進行更多的調查和研究。如果用戶沒有研究過 AI,可以用 MATLAB 提供的 APP 進行學習,去嘗試所有機器學習的算法。

在 MATLAB 里面做深度學習難嗎?用趙志宏先生的話說,只需要寫 5 行的 MATLAB 代碼,用戶就可以建出一個能夠識別食品的網(wǎng)絡。筆者已經多年沒接觸過 MATLAB 了,所以無從考證,工程師朋友們如果需要可以進行嘗試。

和開源代碼如何協(xié)作?

現(xiàn)在市面上的開源非常熱,工程師們可以在開源社區(qū)快速獲得需要的代碼,在人工智能領域也有很多開源資源,作為封閉資源的 MATLAB 和開源代碼相比更新速度可能會較慢,而且加上是收費模式,工程師們也擔心兩者的融合問題。當筆者問到這個問題的時候,趙志宏先生解釋,“開源代碼背后有很多的開發(fā)人員啊,為開源代碼做貢獻,我們也有自己的開發(fā)團隊。我們并不把開源代碼和 MATLAB 定義為嚴格的競爭關系,實際上我們各有特點和長處,有時候我們是可以與開源代碼共用。有一些開源代碼可以在 MATLAB 里面運行或者直接調用,我們在共同為科技進步做貢獻。我們雖然是付費軟件,但是提供的不僅是工具,還有很多的服務?!?/p>

“當用戶使用 MATLAB 時遇到問題,我們后面有很強的技術支持團隊幫用戶解決這些問題。另外,我們的工具不僅是針對某一功能產生正確的結果,我們還考慮把這個功能做得非常的容易使用。比如針對 AI 應用,我們把界面做得非常適合該專業(yè)領域,而且兼顧讓用戶感覺在使用熟悉的 MATLAB 或者 Simulink 的界面。這是我們的優(yōu)勢,如果用戶在 MATLAB 或者 Simulink 中增加新功能,學習門檻不會很高,容易上手設計。除了提供工具,我們還給用戶提供了很多便利,這是從開源工具中所得不到的東西。”趙志宏先生補充。

與非網(wǎng)原創(chuàng)內容,未經允許,不得轉載!

Mathworks

Mathworks

MathWorks是為工程師和科學家提供數(shù)學計算和基于模型的設計的軟件開發(fā)商和供應商,總部位于美國馬薩諸塞州納蒂克(Natick)。MathWorks擁有5000多名員工,在全球擁有33個辦公地點,公司開發(fā)的MATLAB和Simulink在計算生物學、芯片設計、控制系統(tǒng)、圖像處理與計算機視覺、數(shù)據(jù)科學、物聯(lián)網(wǎng)、機器人、機器學習、信號處理、無線通信等領域均有廣泛應用。

MathWorks是為工程師和科學家提供數(shù)學計算和基于模型的設計的軟件開發(fā)商和供應商,總部位于美國馬薩諸塞州納蒂克(Natick)。MathWorks擁有5000多名員工,在全球擁有33個辦公地點,公司開發(fā)的MATLAB和Simulink在計算生物學、芯片設計、控制系統(tǒng)、圖像處理與計算機視覺、數(shù)據(jù)科學、物聯(lián)網(wǎng)、機器人、機器學習、信號處理、無線通信等領域均有廣泛應用。收起

查看更多

相關推薦

電子產業(yè)圖譜