基于主動視覺的FRAD系統(tǒng) 美國洛克西德馬丁公司資助通用電氣研發(fā)中心完成了對遠距離人臉識別開發(fā)的一個原型系統(tǒng),其稱之為“生物特征監(jiān)控系統(tǒng)”,該系統(tǒng)是一套基于多攝像機追蹤架構(gòu)的遠距離監(jiān)控的人臉圖像采集原型系統(tǒng),系統(tǒng)應用固定的WFOV攝像機進行可靠的人體檢測和追蹤,并采用卡爾曼濾波器對人體位置進行追蹤,確保預測出PTZ攝像機能夠采集到人臉圖像的位置。人體追蹤系統(tǒng)可同時處理視場內(nèi)的多個目標,優(yōu)先選擇系統(tǒng)會選擇一個目標進行圖像采集,這時攝像機將逐一快速對準目標,確保能夠采集到視場內(nèi)所有目標的人臉圖像,zui后采用商業(yè)人臉識別器進行人臉圖像處理。實踐表明,該系統(tǒng)的人體定位距離可達25~50米,人臉圖像采集距離可達15~20米。
該系統(tǒng)的一個重要創(chuàng)新是將生物特征識別與可靠的地面人體追蹤器結(jié)合起來,在使用時人一旦進入WFOV攝像機視場內(nèi),追蹤器就能夠鎖定該目標直到目標走出攝像機視場。在應用中,攝像機采集到的人臉圖像和識別結(jié)果會與存儲于內(nèi)部數(shù)據(jù)結(jié)構(gòu)的追蹤目標ID進行關(guān)聯(lián),這樣可以在長時間內(nèi)累積識別信息,允許目標選擇系統(tǒng)選擇還未識別的追蹤目標。該系統(tǒng)具有多個可配置運行模式,包括自動注冊和基于網(wǎng)絡(luò)的自動注冊數(shù)據(jù)共享(當目標從一個攝像機區(qū)域移動到另一個攝像機區(qū)域后,允許重復目標識別)。
1.系統(tǒng)的應用設(shè)計
(1)硬件
該系統(tǒng)可由多個節(jié)點組成,每個節(jié)點由一對WFOV和NFOV攝像機構(gòu)成,攝像機置于標準的架高工作臺上,兩臺攝像機均為索尼的EV1-HD1,攝像機通過串口VISCATM接口連接,其中WFOV攝像機分辨率為640×480,30Hz(NTSC),固定角度;NFOV攝像機分辨率為1280×720,30Hz,其角度、轉(zhuǎn)向和放大倍數(shù)由計算機控制。
(2)人體檢測和追蹤
在WFOV靜態(tài)攝像機視場中檢測并追蹤移動的人體,由于攝像機是靜止的,所以該系統(tǒng)采用了背景差分法檢測移動目標。系統(tǒng)對每一個像素的每一個顏色分量分布采用了自適應的參數(shù)模型,任何與建模不符的像素都將被認定為前景像素。在追蹤的過程中,焦距、WFOV攝像機的方向和位置等內(nèi)外參數(shù)都通過一個計算過程得出,這些參數(shù)通過真實坐標與WFOV攝像機視頻幀映射得到。假定一個人在行走,計算視頻中包含整個人體的可行區(qū)域,那些能夠匹配可行區(qū)域的前景像素簇即為檢測到的人體。人體檢測過程在WFOV視頻中以10Hz的頻率進行,其中采用了卡爾曼濾波器,這使得系統(tǒng)對于瞬時干擾更加穩(wěn)定,并且卡爾曼濾波器提供了追蹤目標的速度,這樣就可以預測目標的前行位置。
(3)PTZ控制器
PTZ控制器主要是對PTZ攝像機的平移、旋轉(zhuǎn)、放大倍數(shù)的控制。在具體操作時,根據(jù)WFOV攝像機畫面對NFOV攝像機畫面進行計算,首先NFOV攝像機處于原始位置,即平移和傾斜角度0°,放大倍數(shù)為1,采用點對應估算WFOV和NFOV攝像機畫面中同一點的位置關(guān)系。NFOV攝像機經(jīng)過進一步計算,以確定平移、傾斜和放大設(shè)置對其畫面的影響。在這個計算的過程中,十分和重要的部分是攝像機的放大點,放大點就是當放大倍數(shù)改變時真實世界坐標不變的點,通常是一幅圖像的中心。實踐表明確切的放大點根據(jù)設(shè)備的不同而不同,當對遠距離物體采用高放大倍數(shù)時,即使很小的放大點偏移也會影響抓拍目標的準確性。在該計算過程中,一旦在WFOV視頻中確定了目標位置和區(qū)域尺寸,就直接確定了NFOV平移、傾斜和放大倍數(shù)的設(shè)置,這會使得目標圖像填滿整個NFOV的畫面。
(4)目標選擇
對于目標的選擇,一般在低分辨率的WFOV視頻中可能會檢測和追蹤到多個目標,因此該系統(tǒng)采取了優(yōu)先選擇機制選擇目標,自動控制NFOVPTZ攝像機采集目標的高分辨率人臉圖像。目標優(yōu)先選擇基于目標的歷史記錄和當前狀態(tài),對于每一個被追蹤的目標都有一個用于優(yōu)先選擇的目標記錄。該記錄包括過去目標被檢測的次數(shù)、人臉圖像采集的次數(shù)和人臉識別的成功次數(shù)。通過人體追蹤器中的卡爾曼濾波器可以確定以下幾個參數(shù):目標到攝像機節(jié)點間的距離、方向余弦和目標的速度。(方向余弦是指目標行走方向與攝像機方向夾角的余弦,表明了目標正臉與攝像機節(jié)點間的角度。)
表1用于計算目標得分的參數(shù)
使用以上信息對被追蹤目標進行評分,評分zui高的將被選為人臉圖像采集對象。評分的得出主要是將每一參數(shù)乘以一個系數(shù),并對結(jié)果進行省略處理再相加,zui后得到zui終的評分,如表1所示為一組參數(shù)和系數(shù)。例如,目標的方向余弦乘以系數(shù)10,然后限定于[-8,8]內(nèi),再與其它分數(shù)相加就得到評分。類似地,目標的速度(米/秒)乘以10,限定于[0,20]的范圍內(nèi),目標移動得快意味著會更快離開覆蓋區(qū)域,所以增加了優(yōu)先選擇的分數(shù)。而采集次數(shù)、成功采集人臉圖像的次數(shù)和成功識別人臉的次數(shù)的系數(shù)都為負數(shù),這將對優(yōu)先選擇減分,減少系統(tǒng)重復采集。系統(tǒng)為各個參數(shù)限定了范圍,可避免任何一個單獨的參數(shù)過大而影響優(yōu)先選擇分數(shù)。總之,優(yōu)先選擇過程是在挑選行進速度快、面向攝像機的目標。在實際中,目標選擇機制使得系統(tǒng)能夠從一個目標向另一個目標移動,去選擇未出現(xiàn)過的、有用的人臉圖像。
一旦選定了目標,人體追蹤器中的卡爾曼濾波將預測出目標在下0.5~1.0秒的人臉位置,然后NFOV攝像機將調(diào)解放大倍數(shù)等參數(shù)指向該位置,直到目標經(jīng)過。這個做法為系統(tǒng)留有完成平移、傾斜和放大設(shè)置的時間,當目標經(jīng)過NFOV攝像機畫面時,目標的人臉和上身將通過NFOV攝像機視頻畫面的中心,然后由基于NFOV視頻圖像的人臉檢測模塊進行人臉檢測和采集。一旦完成采集,系統(tǒng)將馬上開始選擇新目標,即系統(tǒng)大約每隔1~2秒指示攝像機采集一幅新的人臉圖像。
除了選擇目標和確定NFOV攝像機指向的位置外,系統(tǒng)還必須選擇NFOV攝像機的放大倍數(shù)。放大倍數(shù)與成功采集人臉的幾率間存在一個平衡,高放大倍數(shù)可獲得高分辨率的人臉圖像,但任何目標追蹤上的差錯都將使人臉采集成功率大大降低。該系統(tǒng)采用了一種自適應的放大倍數(shù)選擇方法,如果一個目標從沒被成功采集過人臉圖像,那么初始采集人臉圖像分辨率的目標設(shè)定為雙眼間30個像素。然后,每次以某分辨率成功采集人臉圖像后,其分辨率目標值將提高20%,如果系統(tǒng)重復采集該目標圖像,其分辨率將逐漸提高。人臉圖像的分辨率目標值和人的距離決定了NFOV攝像機的放大倍數(shù)。
NFOV攝像機具有自動和手動對焦模式,NFOV攝像機的自動對焦功能偶爾會出現(xiàn)對焦不準模糊的情況,不過利用目標位置和距離兩個數(shù)據(jù)可以解決這個問題。在使用中,*的攝像機設(shè)備和典型的目標距離使得焦距相對較遠,所以在使用時不必知道非常的目標距離,只有當焦距調(diào)整超過幾米的可調(diào)閾值范圍內(nèi)時才需要調(diào)整攝像機的焦距。
(5)人臉檢測和剪切
在人臉檢測和剪切方面,目標鎖定程序指示NFOV攝像機連續(xù)監(jiān)視NFOV攝像機視頻流中的人臉圖像,采用匹茲堡模式識別FT-SDK檢測NFOV視頻中每一幀的人臉。這個過程的運行頻率為10Hz,與圖像刷屏率相同保持實時操作。如果在一幀圖像中檢測到了多個人臉,系統(tǒng)只選擇zui靠近圖像中心的人臉,其更可能是選定的目標,然后將目標人臉圖像剪切下來,異步傳輸至人臉識別器,同時告知目標鎖定器人臉采集完畢,然后更新目標記錄。
(6)人臉識別
當人臉識別器接收到新的剪切人臉圖像后,系統(tǒng)將創(chuàng)建人臉采集記錄并存儲該圖像。人臉識別器根據(jù)圖像采集的時間詢問目標鎖定器,以確定人臉圖像來自哪個追蹤目標ID。目標鎖定器保存一個追蹤目標的時間記錄作為ID號,人臉采集記錄與之相關(guān)聯(lián)。系統(tǒng)可以以10Hz的頻率采集人臉圖像,但是人臉識別每幅圖像通常需要0.5~2秒的時間,這主要取決于算法。一般情況下,識別與采集并不同步,所以人臉識別是異步進行的。
在處理環(huán)節(jié)中,重復應用人臉識別器識別采集的未識別圖像,結(jié)果存儲于人臉圖像采集記錄中,未處理的人臉圖像在30秒后被丟棄。人臉識別次數(shù)和結(jié)果存于目標記錄中的人臉圖像采集記錄中,并顯示于程序中。人臉識別結(jié)果傳遞至目標鎖定器以更新目標記錄,人臉識別結(jié)果同時被GUI使用以標注WFOV視頻中被追蹤目標的名字。
本系統(tǒng)配有可選的自動注冊功能可以利用每一個追蹤目標的目標記錄,這是一個可配置的基于規(guī)則的過程,其目標是利用采集到的未注冊且適于注冊的人臉圖像進行自動注冊。自動注冊目標必須具有至少一幅質(zhì)量超過人臉識別匹配閾值的人臉圖像,并且采用至少4幅不同的人臉圖像進行識別的結(jié)果均為失敗。這個過程可幫助確保用于自動注冊的人臉圖像確實是未知圖像。
性能評估
為了測試該生物特征監(jiān)控系統(tǒng)的性能,通用公司設(shè)計了一個實驗模仿交通運輸樞紐中心的情況,如機場或地鐵站。系統(tǒng)被安置于室內(nèi)和室外的固定位置。室內(nèi)測試在一個很長(寬大約為9米)的走廊內(nèi)進行,光照為來自窗戶的自然光和屋頂?shù)膸讉€日光燈。這個走廊與機場航站樓相似,如圖1所示。此地的光照情況隨著時間和天氣而變化,從晴朗天氣的很亮到陰雨天或夜晚的昏暗。在進行室外測試時,攝像機分別朝向和背對太陽,試驗進行了6天以經(jīng)歷不同的變化。在試驗過程中,被測試目標以自然的方式步行穿過走廊或室外區(qū)域。
表2試驗數(shù)據(jù)
*項試驗將評估人體檢測和人臉圖像采集的性能,表2所示為采集數(shù)據(jù),圖3中的直方圖為初始人體檢測和初始人臉采集的距離。盡管被測目標的行為是可控的,但此過程中出現(xiàn)了其他非測試人員,包括在攝像機視場中靜止不動的人員。這些非測試人員甚至并不知曉正在進行測試。在全部的466次試驗中,只有1例人體檢測失敗和8例人臉采集失敗,原因是該目標或其臉部以某種方式被遮擋。
表3試驗數(shù)據(jù)
表3為人體檢測、人臉檢測和人臉識別的均值和標準方差,我們可以看到,人體檢測和人臉采集的平均范圍大約是人臉識別的兩倍,這是由于人臉識別算法需要高分辨率人臉圖像,這也是現(xiàn)有人臉識別算法的局限性。
結(jié)語 通用公司的人體生物特征監(jiān)控系統(tǒng)的主要是通過目標追蹤、目標選擇和自動PTZ攝像機控制進行人臉圖像采集,目標是采集高分辨率人臉圖像,并通過第三方人臉識別軟件進行識別。這種基于自動攝像機控制的遠距離人臉識別系統(tǒng)可以在目標不知情或非合作的情況下,在相對大的范圍內(nèi)進行人體生物特征識別,其可應用于很多重要場合,而其他的生物特征識別技術(shù)如指紋、虹膜等都需要被識別人的合作以及近距離采集。該生物特征監(jiān)控系統(tǒng)可以在20~25米遠的距離追蹤目標,識別距離zui大可達20米。目前類似這樣的系統(tǒng)已經(jīng)在實踐中得到較好的應用,顯現(xiàn)出遠距離人臉識別良好的應用前景。