0引言
人臉識別是生物特征識別的重要組成部分。在商業(yè)、安全及司法等行業(yè)具有非常廣泛的應(yīng)用。人臉識別的方法主要通過計算機來實現(xiàn)一項智能的判別任務(wù)。總體而言,對圖像的人臉識別可以是以下一些定義和描述:
(1)給定靜止或視頻圖像,進行搜索,實現(xiàn)判斷,找出人臉;
(2)確定一副照片中人臉的狀態(tài),如性別、表情、年齡等;
(3)給定未知人臉圖像,與圖庫中已有人臉圖形進行比較,鑒別歸類。
這些任務(wù)適合于不同工作環(huán)境的要求,有些復(fù)雜系統(tǒng)可能包含上述的全部內(nèi)容。人臉識別的處理方法主要有基于幾何特征和代數(shù)特征的識別方法,前者將各個器官定位識別,簡單易理解,但魯棒性較差。
基于代數(shù)特征的識別方法,其核心思想是將人臉圖像視作多維(即圖像像素數(shù)目)的矢量集。對這些矢量進行統(tǒng)計識別或變換映射,達到分類識別的目的。這些多維變化映射判別的方法也就是常使用的子空間法。
本文利用獨立成分分析(ICA)的方法對人臉的圖像進行識別,構(gòu)造的訓(xùn)練庫具有多種表情和姿勢。其識別具有較強的魯棒性和正確率。對其中一些處理結(jié)果進行分析比較,具有廣泛的應(yīng)用價值。
1ICA處理方法基本原理
獨立成分分析是盲信號分離中應(yīng)用較成功的算法,其假設(shè)信號是若干獨立源信號混合而成,采用適當(dāng)投影,可以將其中的二階和高階統(tǒng)計信息提取出來,而且還能消除高階相關(guān)性。其基本的做法是利用ICA算法對訓(xùn)練集圖像進行求解得出一組獨立的影響基,待測試的圖像識別時,將其按照各個基的方向上進行投影。這樣再利用距離等判別方法可以確定測試圖所屬的類別。
利用ICA算法對人臉進行識別,人臉的訓(xùn)練樣本影像集X可以作為統(tǒng)計獨立的基影像S和可逆混合矩陣A的線性組合:
X=AS
ICA算法的目的就是找出混合矩陣A或者分立矩陣W,使其滿足下式:
其中,I為獨立統(tǒng)計基影像S的估計。
從統(tǒng)計學(xué)觀點上來講,隨即變量的非高斯性與統(tǒng)計獨立密切相關(guān),非高斯性zui強的方向即ICA尋找的投影方向。因此,只要找出非高斯性zui大情況下,對應(yīng)的就是要找的獨立成分方向。
2算法概述及基本處理過程
2.1圖像庫選擇和圖像預(yù)處理
本文采用的圖像庫為OlivettiResearchLaboratory標(biāo)準(zhǔn)人臉數(shù)據(jù)庫(如圖1所示)。人臉庫中共有40人的人臉照片,每人10幅,共400幅圖片,圖像格式為pgm,是移動式位圖文件,處理起來較簡便。每人的圖片都是不同角度、不同時間且受一定光線和一些飾物(如眼鏡等)影響。圖像大小為112×92。很多
文獻中可以對原始圖像進行一定處理,在保持圖像原有信息的情況下,盡可能減小圖像尺寸。可以有效降低圖像像素數(shù)目,也相當(dāng)于后續(xù)處理前的一個降維。如采用小波處理等一些頻譜臉處理方法或采用圖像分割提取出臉部畫面可提高信息有效性。
對人臉輸入數(shù)據(jù)(首先是訓(xùn)練樣本)灰度數(shù)據(jù)排列,即得到一個矩陣,其每一行是訓(xùn)練圖的各行灰度值首尾相連表示,列數(shù)即是訓(xùn)練圖的總數(shù)。具體的圖像指代人臉編號,可以用以卷標(biāo)函數(shù)進行定義。
對數(shù)據(jù)矩陣進行中心化處理,即去均值處理,然后進行白化處理,使得白化后的變量協(xié)方差矩陣為單位矩陣,利用協(xié)方差特征值分解。這些處理的主要目的是使得計算量能夠減小。
2.2ICA獨立成分基的生成
2.3人臉的識別
將待測試的人臉圖像數(shù)據(jù)提取出,進行中心化和白化,然后再按上面所描述的方法生成的獨立成分基上進行投影。每一個測試圖都用余弦(cosine)判別方法來找出zui近的類別。從而進行歸類。余弦公式表述如下:
這就是一種相關(guān)系數(shù)的計算,相關(guān)系數(shù)越大說明兩個特征向量的相似度就越高。這樣,待測的向量(如mat2)就可以判斷為mat1的人臉類別。將判斷結(jié)果和真實值進行比較,可計算識別的正確率。
3實驗結(jié)果及分析
按照上述方法,本文對人臉進行測試,對該算法下的實驗效果,有幾個問題值得關(guān)注,實驗也是基于這些問題來進行測試的:
(1)訓(xùn)練樣本和測試樣本比例,對測試結(jié)果正確率的影響問題;
(2)訓(xùn)練樣本和測試樣本的總體數(shù)目,對于測試結(jié)果正確率的影響;
(3)獨立成分個數(shù)對于測試結(jié)果的影響。
3.1訓(xùn)練樣本數(shù)目對測試結(jié)果的影響
訓(xùn)練樣本的數(shù)目對于測試結(jié)果顯然影響較大,如果在可能的條件下,得到盡可能多的訓(xùn)練集,就可以使測試結(jié)果大大提高。圖2是40人,訓(xùn)練樣本每人取5、6、7、8、9等情況下所得到的識別正確率曲線。
3.2不同的數(shù)據(jù)集大小對識別率的影響
不同大小數(shù)據(jù)集,即訓(xùn)練和測試人數(shù)的大小對測試結(jié)果有一定的影響。圖3描述了這一影響的實驗結(jié)果。可以看出數(shù)據(jù)集大小和正確率大體是負相關(guān)(不是很嚴(yán)格),僅40人的訓(xùn)練和測試集識別率就有較大的降低。因此,對于較大規(guī)模且較重要的人臉識別過程必須考慮識別結(jié)果的可靠性。當(dāng)然只有在訓(xùn)練數(shù)目以及下面要提到的獨立成分分量數(shù)等方面選用較嚴(yán)格的參數(shù)。
3.3獨立成分分量數(shù)目對識別率的影響
獨立成分分量數(shù)目對識別率的影響是兩個方面的。一方面獨立成分分量數(shù)目越多,識別的精度就越高,但是從另一方面來講,獨立成分分量數(shù)目太多會影響計算的速度。在實驗過程中雖然是少樣本,速度可以承受,但是如果訓(xùn)練集很大,獨立成分分量數(shù)比較多,則會影響到識別的速度。一般個人微機(2.6G雙核)如處理1萬像素圖像400樣本需耗時3小時以上才可以達到zui大正確率。要求不高情況下,獨立成分分量數(shù)目達到訓(xùn)練集的30%已經(jīng)足以達到較佳效果。圖4是不同獨立成分分量數(shù)目下,測試的結(jié)果。每組訓(xùn)練樣本為6個,測試樣本為4個。從圖4中可以看出,對于訓(xùn)練測試人數(shù)較少時,測試成功率較易達到很高的正確識別率(0.975%)。也可以說容易達到收斂。
4結(jié)束語
本文利用獨立成分分析對人臉進行了識別實驗。通過將人臉圖像投影到子空間進行分類識別,達到判斷人臉的目的。結(jié)果表明這種基于獨立成分投影方法具有較高的準(zhǔn)確率,并對于獨立成分分析中一些比較重要的參數(shù)選擇問題,進行了對比實驗,以期在計算效率和準(zhǔn)確率上達到一個均衡。實驗結(jié)果表明,訓(xùn)練集的數(shù)目,總體樣本人數(shù)以及采用的獨立分量個數(shù)都對計算正確率有很大影響,呈現(xiàn)一種非線性的相關(guān)。這些結(jié)果也有助于設(shè)計人臉識別軟件,或執(zhí)行識別任務(wù)時參考。
版權(quán)與免責(zé)聲明:
凡本網(wǎng)注明“來源:智慧城市網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-智慧城市網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源:智慧城市網(wǎng)www.cmr6829.com”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
本網(wǎng)轉(zhuǎn)載并注明自其它來源(非智慧城市網(wǎng)www.cmr6829.com)的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點或和對其真實性負責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時,必須保留本網(wǎng)注明的作品第一來源,并自負版權(quán)等法律責(zé)任。
-
免費注冊后,你可以
了解安防行業(yè)更多資訊查看安防行業(yè)供求信息凸顯安防行業(yè)自身價值
馬上注冊會員
-
想快速被買家找到嗎
只需要發(fā)布一條商機,被買家找到的機會高達90%!還等什么?
馬上發(fā)布信息