近年來,隨著“平安城市建設”的大力推進,越來越多的高清攝像頭部署在各個重要場所,如機場、地鐵、火車站、汽車站等。這些場所是人口流動必經之地,也是*重點布控區域。很多地區提出的人臉識別需求,也是針對這些重要通道出入口場景,要求系統自動偵測視頻畫面中的人臉,并與數據庫中的人臉數據進行一一比對,得到zui有可能的身份信息。2012年上映的電影《碟中諜4》中,也有類似的人臉識別概念,相信看過此片的朋友對下面這個片段會有一定的印象。電影中,探員漢納威在火車站利用同事傳過來的目標人臉信息,配合人臉識別系統,快速檢索比對過往人群,zui終找到并抓捕嫌犯。事實上,這樣的人臉識別系統已經從銀幕走向現實。本文將首先對人臉識別技術原理進行介紹,然后介紹幾種典型的系統應用,zui后對人臉識別技術未來的發展方向進行分析。
人臉識別技術概述
廣義的人臉識別主要分為人臉檢測(facedetection)、特征提取(featureextraction)和人臉識別(facerecognition)三個過程,
典型的人臉識別過程
其中,第三步提到的人臉識別是狹義的人臉識別,即將待識別人臉所提取的特征與數據庫中人臉的特征進行對比,根據相似度判別分類。而人臉識別又可以分為兩個大類:一類是確認(verification),這是人臉圖像與數據庫中已存的該人圖像比對的過程,回答你是不是你的問題;另一類是辨認(identification),這是人臉圖像與數據庫中已存的所有圖像匹配的過程,回答你是誰的問題。顯然,人臉辨認要比人臉確認困難,因為辨認需要進行海量數據的匹配。在辨認過程中,海量數據的處理、特征提取和分類算法的選擇變得非常重要。識別率和識別速度是人臉識別技術中主要的衡量算法性能的指標。本文后面提到的人臉識別,主要指的是人臉辨認。
人臉識別技術原理
人臉識別算法發展到今天,大致上可以分為兩類:基于特征的人臉識別算法和基于外觀的人臉識別算法。其中,多數基于特征的人臉識別算法屬于早期的人臉識別算法,現在已經不再使用。不過近些年出現了一些新的基于特征的算法,并取得不錯的效果。而基于外觀的人臉識別算法是由于實現簡單,受到廣泛關注。接下來將分別介紹兩類人臉識別算法。
基于特征的人臉識別算法:早期的人臉識別算法主要是基于特征模板和幾何約束來實現的。這一類算法首先對輸入圖像進行處理,提取出如眼睛、鼻子和嘴等面部特征和外觀輪廓。然后計算這些面部特征之間的幾何關系,如距離、面積和角度等。這樣將輸入圖像轉換為幾何特征向量后,使用標準的統計模式識別技術進行匹配分類。由于算法利用了一些直觀的特征,計算量小。不過,由于其所需的特征點不能選擇,限制了它的應用范圍。另外,當光照變化、人臉有外物遮擋、面部表情變化時,特征變化較大。所以說,這類算法只適合于人臉圖像的粗略識別,無法在實際中應用。
一些典型的面部幾何特征示意圖
以上這些方法都是通過一些特征模板和幾何約束來檢測特定的面部特征,并計算特征之間的關系。還有一些方法使用了圖像的局部表示來提取特征。其中zui受關注的方法是局部二值模式(LBP)算法。LBP方法首先將圖像分成若干區域,在每個區域的像素3x3鄰域中用中心值作閾值化,將結果看成是二進制數。圖3顯示了一個LBP算子。LBP算子的特點是對單調灰度變化保持不變。每個區域通過這樣的運算得到一組直方圖,然后將所有的直方圖連起來組成一個大的直方圖并進行直方圖匹配計算進行分類。
LBP算子
基于特征的人臉識別算法主要的優勢在于對姿態、尺度和光照等變化魯棒。由于多數特征是基于手動選擇和先驗知識,受圖像本身的成像質量影響較少。另外,提取出的面部特征往往維數較低,匹配速度快。這些方法的缺點是自動特征提取的難度較大。如果特征集的鑒別能力弱,再多的后續處理也無法補償本身的不足。
基于外觀的人臉識別算法:基于外觀的人臉識別算法也稱為整體方法。它們使用圖像的全局信息來辨識人臉。zui簡單的整體方法是用二維數組來存放圖像的灰度值,然后直接對輸入圖像和數據庫中的所有圖像進行相關性比較。這種方法的缺點非常多,如易受環境影響、計算耗時等。其中一個重要的問題是這樣的分類是在一個非常高維的空間中進行的。為了克服維數問題,一些算法使用統計降維方法來獲取和保留更有用的信息,zui典型的算法就是主成分分析(PCA)算法和線性鑒別分析(LDA)算法。
PCA算法指出任何特定的人臉可以由一個低維的特征子空間表示,并可以用這個特征子空間近似地重建。將輸入人臉圖像投影到特征子空間上得到的特征與已知的數據庫進行比對來確定身份。PCA算法選取的特征zui大化了人臉樣本間的差異,但也保留了一些由于光照和面部表情產生的不必要的變化。而同一個人由于光照產生的變化可能會大于不同人之間的變化,如圖4所示。LDA算法在zui大化不同個體之間的樣本差異的同時,zui小化同一個體內部的樣本差異。這樣達到了人臉特征子空間的劃分。圖5是PCA和LDA算法的示例。其中,PCA的特征臉是由組成PCA特征子空間的特征向量按二維圖像來排列得到的類似人臉的圖像。LDA的Fisher臉也是同樣道理。經過特征臉和Fisher臉重構得到的人臉圖像在第四行。可以看到,PCA重構臉與輸入人臉差異較小,但LDA的Fisher臉很難辨認,但突出了該個體的顯著特征。PCA和LDA方法都假設存在一個*的投影子空間。這個子空間的每個區域對應*的一個人。然而,事實上在人臉空間中許多人經常會映射到相同的區域中,因此這種假設并不成立。
同一個人在不同光照下的圖片
整體方法主要的優點是它們沒有丟棄圖像中的任何信息。然而,這也是它們的缺點。整體方法一般假設圖像中的所有像素是同等重要的。因此,這些技術不僅計算耗時,而且需要測試樣本與訓練樣本高度相關。當人臉圖像的姿態、尺度和光照發生較大變化時識別性能一般。
PCA和LDA算法的示例
人臉識別系統應用
人臉識別的應用范圍很廣,從門禁、設備登錄到機場、公共區域的監控。表1給出了一些人臉識別的應用領域。
表1 人臉識別的應用領域
以*應用為例,*部門在查辦案、處理事務時常常會遇到一些不明身份的人員,比如走丟的老人、小孩,拒不交代身份的嫌疑犯,無人認領的尸體等。這時傳統的方法往往不能解決問題。利用人臉檢索系統,將目標人臉輸入到系統中。系統自動在海量人口數據庫中進行查找比對,列出前若干名相似的人員信息。然后再通過人工干預的方式,對系統結果進行篩選,得到目標的真實身份。
文章開頭提到的是另外一種應用。即在一些重要的通道出入口,部署高清探頭,專門用于抓拍經過的人臉并傳送給后端系統。后端系統將人臉圖片與所關注的人臉庫(比如VIP客戶,或者在逃嫌疑犯等)進行逐一比對。當發現有目標與庫中人員相似度超過設定閾值時,系統自動提示相關人員采取措施。
人臉識別技術發展趨勢 前面提到了人臉識別的一些典型算法和應用,但人臉識別技術發展到今天,還存在一定的局限性。圖4是同一個人在不同光照下的圖片,很直觀地可以看出,即使是同一個人,在不同光照下用肉眼也很難辨別。除了光照,還有姿態、表情、年齡等因素限制了人臉識別的應用。目前的人臉識別系統只能在一些較規范的環境下進行,人臉需要正對著攝像機,并保證人臉在畫面中有一定的像素寬度。但是在實際的安防監控場合中,這些限制條件很難一一滿足。這就為人臉識別技術提出了更大的挑戰。未來的人臉識別算法需要進一步提高精度,提高環境適應性,以滿足實際的應用需求。
現在已經有一些機構、高校在進行人臉識別新領域、新技術的研究。比如遠距離人臉識別技術,3D人臉識別技術等。遠距離人臉識別系統面臨兩個主要困難。首先是如何從遠距離獲取人臉圖像。其次,在得到的數據并不理想的情況下,如何識別身份。從某種意義上來看,遠距離人臉識別并不是一個特定的關鍵技術或者基礎研究問題。它可以看成是一個應用和系統設計問題。通常有兩類解決方法用于獲取人臉圖片。一種是高清的固定式攝像機,另一種是使用PTZ控制系統多攝像機系統。后者更適合于一般情況,不過其結構更為復雜,造價也更貴。后者需要考慮如何協調多臺攝像機的同步操作。一般地,系統由低分辨率廣角攝像機和高分辨率長焦攝像機組成。前者用于檢測和追蹤目標,后者用于人臉圖像采集和識別。目前遠距離人臉識別技術還處于實驗室階段,未來如果能夠解決上述問題,對人員布控這樣的應用有著重要意義。
3D人臉識別能夠很好地克服2D人臉識別遇到的姿態、光照、表情等問題。主要原因是2D圖像無法很好地表示深度信息。通常,3D人臉識別方法使用3D掃描技術獲取3D人臉,然后建立3D人臉模型并用于識別。不過,3D人臉識別技術的缺點也是很明顯的。首先它需要額外的3D采集設備或雙目立體視覺技術,其次,建模過程需要的計算量較大。相信隨著未來芯片技術的發展,當計算能力不再受到制約,采集設備成本大幅下降的時候,3D人臉識別將會成為熱門技術之一。(文/大華股份滿江月)