什么是
人臉識別系統(tǒng)
人臉識別是指能夠識別或驗證圖像或視頻中的主體的身份的技術(shù)。人臉識別算法誕生于七十年代初。自那以后,它們的準(zhǔn)確度已經(jīng)大幅提升,現(xiàn)在相比于指紋或虹膜識別等傳統(tǒng)上被認為更加穩(wěn)健的生物識別方法,人們往往更偏愛人臉識別。讓人臉識別比其它生物識別方法更受歡迎的一大不同之處是人臉識別本質(zhì)上是非侵入性的。比如,指紋識別需要用戶將手指按在傳感器上,虹膜識別需要用戶與相機靠得很近,語音識別則需要用戶大聲說話。相對而言,現(xiàn)代人臉識別系統(tǒng)僅需要用戶處于相機的視野內(nèi)(假設(shè)他們與相機的距離也合理)。這使得人臉識別成為了對用戶友好的生物識別方法。這也意味著人臉識別的潛在應(yīng)用范圍更廣,因為它也可被部署在用戶不期望與系統(tǒng)合作的環(huán)境中,比如監(jiān)控系統(tǒng)中。人臉識別的其它常見應(yīng)用還包括訪問控制、欺詐檢測、身份認證和社交媒體。
當(dāng)被部署在無約束條件的環(huán)境中時,由于人臉圖像在現(xiàn)實世界中的呈現(xiàn)具有高度的可變性(這類人臉圖像通常被稱為自然人臉(faces in-the-wild)),所以人臉識別也是有挑戰(zhàn)性的生物識別方法之一。人臉圖像可變的地方包括頭部姿勢、年齡、遮擋、光照條件和人臉表情。
人臉識別技術(shù)這些年已經(jīng)發(fā)生了重大的變化。傳統(tǒng)方法依賴于人工設(shè)計的特征(比如邊和紋理描述量)與機器學(xué)習(xí)技術(shù)(比如主成分分析、線性判別分析或支持向量機)的組合。人工設(shè)計在無約束環(huán)境中對不同變化情況穩(wěn)健的特征是很困難的,這使得過去的研究者側(cè)重研究針對每種變化類型的方法,比如能應(yīng)對不同年齡的方法、能應(yīng)對不同姿勢的方法、能應(yīng)對不同光照條件的方法等。近段時間,傳統(tǒng)的人臉識別方法已經(jīng)被基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的深度學(xué)習(xí)方法接替。深度學(xué)習(xí)方法的主要優(yōu)勢是它們可用非常大型的數(shù)據(jù)集進行訓(xùn)練,從而學(xué)習(xí)到表征這些數(shù)據(jù)的特征。網(wǎng)絡(luò)上可用的大量自然人臉圖像已讓研究者可收集到大規(guī)模的人臉數(shù)據(jù)集,這些圖像包含了真實世界中的各種變化情況。使用這些數(shù)據(jù)集訓(xùn)練的基于CNN的人臉識別方法已經(jīng)實現(xiàn)了非常高的準(zhǔn)確度,因為它們能夠?qū)W到人臉圖像中穩(wěn)健的特征,從而能夠應(yīng)對在訓(xùn)練過程中使用的人臉圖像所呈現(xiàn)出的真實世界變化情況。此外,深度學(xué)習(xí)方法在計算機視覺方面的不斷普及也在加速人臉識別研究的發(fā)展,因為CNN也正被用于解決許多其它計算機視覺任務(wù),比如目標(biāo)檢測和識別、分割、光學(xué)字符識別、面部表情分析、年齡估計等。