作者:金劍超
單位:中國移動智慧家庭運營中心
近年來,隨著人工智能技術(shù)的高速發(fā)展,人臉識別正在融入人們的日常生活,悄然改變?nèi)藗兊纳盍?xí)慣,例如刷臉支付、刷臉開手機、刷臉通行等。那么機器是如何識別這是一個人?它又是怎么辨別是誰的呢?接下來讓我們共同探秘,揭開這“黑科技”背后的面紗。
Part 01●??人臉識別技術(shù)概述?●
人臉識別技術(shù)屬于生物特征識別技術(shù),是一種依據(jù)人人臉的若干特征(如眼睛、鼻子、嘴巴、眉毛等)自動進行身份識別的技術(shù),又被稱為面像識別、人像識別、相貌識別、面孔識別、面部識別等。其主要利用攝像機或攝像頭采集含有人臉的圖像或視頻流,通過人臉檢測技術(shù)分析其是否存在人臉,存在則給出人臉?biāo)谖恢谩⒋笮『兔娌筷P(guān)鍵器官的位置信息;再根據(jù)這些信息提取所蘊涵的身份特征,并將其與已知的人臉特征進行對比,從而識別每個人臉的身份。
Part 02●??人臉檢測?●
人臉檢測是人臉識別和人臉分析系統(tǒng)的關(guān)鍵第一步,主要用于解決“人臉在哪里”的問題,在圖像中準(zhǔn)確標(biāo)定出人臉的位置和大小,并提供給后續(xù)的人臉特征分析和識別。早期的人臉檢測工作主要基于人工精心設(shè)計的局部描述子進行特征提取,主要可分為4類基于知識的人臉檢測方法、基于模型的人臉檢測方法、基于特征的人臉檢測方法、基于外觀的人臉檢測方法,其中比較比較經(jīng)典的作品有haar cascades分類器、HOG(Histogram of Oriented Gridients)特征檢測算法。但傳統(tǒng)的檢測對于多種變異因素的具有挑戰(zhàn)性的圖像,人臉檢測精度有限。
隨著深度學(xué)習(xí)的蓬勃發(fā)展,逐漸演變出許多基于不同深度學(xué)習(xí)架構(gòu)的人臉檢測方法,主要有基于級聯(lián)cnn模型、基于R-CNN模型、單發(fā)探測器模型、基于特征金字塔網(wǎng)絡(luò)模型、基于變形金剛模型等,極大的改善了傳統(tǒng)人臉檢測、識別在特征提取、精確度、可擴展性方面均有諸多不足。MTCNN是其中一個比較優(yōu)秀的人臉檢測模型,該模型通過三個階段的深度卷積網(wǎng)絡(luò),以粗到細的方式預(yù)測人臉和地標(biāo)位置,具體步驟為:第一階段:通過淺層CNN快速生成候選窗口;第二階段:通過更復(fù)雜的CNN拒絕大量非面部窗口來細化窗口;第三階段:使用更強大的CNN再次細化結(jié)果并輸出五個面部標(biāo)志位置。
Part 03●??人臉特征?●
人臉特征也稱人臉表征,是人臉的某些特征,比如臉的長度、臉的寬度、唇部寬度、鼻子長度等,人臉特征提取就是對人臉進行特征建模得到向量化人臉特征的過程。人臉特征提取按照技術(shù)特點大致可分為三類:基于全局信息的Holistic方法、基于局部信息的Local特征方法、基于深度學(xué)習(xí)的方法。基于深度學(xué)習(xí)的人臉特征可以從數(shù)據(jù)集中自動學(xué)習(xí)特征,如果數(shù)據(jù)集能夠覆蓋足夠的魯棒性數(shù)據(jù)(如光照、姿態(tài)、表情等),則算法能適應(yīng)各種挑戰(zhàn),也是當(dāng)前的主流人臉特征提取方法。
Part 04●??人臉識別?●
人臉識別是人臉比對的過程,通過比對提取的人臉特征獲兩個人臉的相似度,判斷方法為比較兩個特征間的歐式距離(L2距離)或者余弦距離(cosine距離):L2距離越小,相似度越高;cos距離夾角越小,cos距離越大相似度越高。根據(jù)比對的數(shù)量不同,又可分為1:1和1:N。1:1最常見的場景就是人證比對,比如我們在乘高鐵時所遇到的這種設(shè)備。1:N是1張人臉和底庫中的N張人臉進行比對,比如在考勤機中,我們的人臉底庫中包含全公司的所有人臉照片。