各行各業(yè)的制造商都面臨著諸多方面的挑戰(zhàn),要雇傭并留住合格員工,要跟上技術(shù)創(chuàng)新的步伐,還要滿足客戶對于速度和精準(zhǔn)度的更高要求。對于汽車制造業(yè)而言,可持續(xù)性、運營和供應(yīng)鏈的數(shù)字化、更高的安全要求以及對個性化的需求也成為其首要關(guān)注的問題。斑馬技術(shù)去年發(fā)布的《汽車生態(tài)系統(tǒng)愿景研究報告》顯示,73%的受訪行業(yè)決策者認(rèn)為,如果不采用更多的數(shù)字化技術(shù),他們的企業(yè)將處于競爭劣勢,其中“開發(fā)軟件專業(yè)知識”被列為決策者的前五大優(yōu)先投資選項之一。麥肯錫發(fā)布的報告也認(rèn)同這一觀點,稱在機器人技術(shù)、AI和機器學(xué)習(xí)方面的最新發(fā)展使我們處于新自動化時代的前沿。
機器視覺作為工業(yè)之“眼”,適用于數(shù)據(jù)采集、識別和檢測等制造流程,隨著中國制造業(yè)用工成本的提高,機器視覺成為推動數(shù)字經(jīng)濟時代制造業(yè)發(fā)展的重要技術(shù);此外,深度學(xué)習(xí)融入機器視覺算法也將驅(qū)動制造業(yè)的智能化升級。其中深度學(xué)習(xí)光學(xué)字符識別(OCR)軟件便是一項重要的技術(shù)創(chuàng)新。根據(jù)斑馬技術(shù)的《汽車生態(tài)系統(tǒng)愿景研究報告》,汽車OEM(原始設(shè)備制造商)決策者認(rèn)為,對比2022年,預(yù)計2027年工業(yè)級機器視覺的使用率將增長83%。
深度學(xué)習(xí)與OCR的結(jié)合能夠滿足制造業(yè)在合規(guī)性、質(zhì)量和存在性檢測方面對速度、準(zhǔn)確度、以及可靠解決方案的需求。汽車、制藥、電子和食品飲料行業(yè)的運營領(lǐng)導(dǎo)者通過深度學(xué)習(xí)OCR獲得的收益更為顯著。
深度學(xué)習(xí)OCR賦能智能制造
機器視覺和深度學(xué)習(xí)OCR正在推動智能制造的發(fā)展,Gartner將智能制造定義為在工廠內(nèi)部以及其他供應(yīng)鏈職能部門之間協(xié)調(diào)物理和數(shù)字化流程的概念,這轉(zhuǎn)變了人員、流程和技術(shù)的運作方式,并提供了可提升決策質(zhì)量、效率、成本和敏捷性所需的信息。換言之,通過深度學(xué)習(xí)和OCR實現(xiàn)制造業(yè)的自動化,有助于從硬件、軟件和人員方面獲得效益。
但要進(jìn)行準(zhǔn)確的OCR檢驗卻頗具挑戰(zhàn),風(fēng)格化的字體,模糊、扭曲或被遮擋的字符,反光的物體表面以及復(fù)雜、不均勻的背景,都可能使傳統(tǒng)OCR技術(shù)無法實現(xiàn)穩(wěn)定識別。所幸的是市場上已經(jīng)有新工具面世,它們具備工業(yè)級深度學(xué)習(xí)OCR功能,并附帶基于數(shù)千種不同圖像樣本進(jìn)行預(yù)訓(xùn)練的即用型神經(jīng)網(wǎng)絡(luò),這一系列新工具能夠開箱即用,即使在處理非常復(fù)雜的情況時也可以確保高準(zhǔn)確性。
這意味著在汽車制造環(huán)境中,深度學(xué)習(xí)OCR解決方案可以準(zhǔn)確地讀取電池、輪胎、零部件和配件上噴印、壓印、以及啞光和金屬質(zhì)地的序列號,以確保其與正確車型的車輛識別號(VIN)相對應(yīng)。這些解決方案還可以應(yīng)對各種字體樣式和大小,并適用于不斷變化且“嚴(yán)苛”的照明及制造環(huán)境。
深度學(xué)習(xí)OCR還可以用作更廣泛的機器視覺解決方案的一部分。例如,在汽車制造環(huán)境中,可以通過部署機器視覺解決方案,檢查連接器針腳是否缺失及其質(zhì)量和合規(guī)性是否達(dá)標(biāo),也可以對印刷電路板上的敷形涂層、粘合劑檢驗、線束組裝、電池極性以及總裝等進(jìn)行檢驗。
在這些場景中,使用相同的機器視覺相機和統(tǒng)一軟件平臺部署的機器視覺解決方案能夠以更快的速度檢驗物品,標(biāo)記出疑似缺陷和錯誤供工程師檢查并判定是否為故障,以進(jìn)一步處理。審查決策將被反饋到神經(jīng)網(wǎng)絡(luò)中,有助于保持持續(xù)學(xué)習(xí)輸入的活躍狀態(tài),從而進(jìn)一步開發(fā)和增強模型。這優(yōu)化了效率,并為工程師免去了一項重要卻繁瑣的手動任務(wù)。
日益增長的深度學(xué)習(xí)價值
深度學(xué)習(xí)的速度和準(zhǔn)確性使其能夠更好地幫助工程師確保生產(chǎn)制造的質(zhì)量,控制生產(chǎn)成本并提高客戶滿意度。此外,易用性也同樣重要,而這正是深度學(xué)習(xí)OCR軟件的優(yōu)勢所在,它是一種易于實施和使用的應(yīng)用,無需機器視覺專業(yè)知識,只需幾個簡單的步驟即可部署。
總的來說,更易于獲取和使用的機器視覺和深度學(xué)習(xí)OCR解決方案為工業(yè)成像專業(yè)人員和工程師解鎖了新的可能性,使他們能夠更像數(shù)據(jù)科學(xué)家一樣思考和行動。面對不斷增長的數(shù)據(jù)生成速度、數(shù)據(jù)量和數(shù)據(jù)多樣性,以及對于生產(chǎn)速度、安全性和準(zhǔn)確性等更高水平的要求,我們相信這一技術(shù)發(fā)展是必要的,也是業(yè)界所樂見的。