1)人臉采集:
?。?)簡(jiǎn)介:
不同的人臉圖像通過(guò)攝像鏡頭采集得到,比如靜態(tài)圖像、動(dòng)態(tài)圖像、不同的位置、不同表情等,當(dāng)采集對(duì)象在設(shè)備的拍攝范圍內(nèi)時(shí),采集設(shè)備會(huì)自動(dòng)搜索并拍攝人臉圖像。
?。?)人臉采集的主要影響因素:
圖像大小:人臉圖像過(guò)小會(huì)影響識(shí)別效果,人臉圖像過(guò)大會(huì)影響識(shí)別速度。非專業(yè)人臉識(shí)別攝像頭常見規(guī)定的最小識(shí)別人臉像素為60*60或100*100以上。在規(guī)定的圖像大小內(nèi),算法更容易提升準(zhǔn)確率和召回率。圖像大小反映在實(shí)際應(yīng)用場(chǎng)景就是人臉離攝像頭的距離。
圖像分辨率:越低的圖像分辨率越難識(shí)別。圖像大小綜合圖像分辨率,直接影響攝像頭識(shí)別距離?,F(xiàn)4K攝像頭看清人臉的最遠(yuǎn)距離是10米,7K攝像頭是20米。
光照環(huán)境:過(guò)曝或過(guò)暗的光照環(huán)境都會(huì)影響人臉識(shí)別效果。可以從攝像頭自帶的功能補(bǔ)光或?yàn)V光平衡光照影響,也可以利用算法模型優(yōu)化圖像光線。
模糊程度:實(shí)際場(chǎng)景主要著力解決運(yùn)動(dòng)模糊,人臉相對(duì)于攝像頭的移動(dòng)經(jīng)常會(huì)產(chǎn)生運(yùn)動(dòng)模糊。部分?jǐn)z像頭有抗模糊的功能,而在成本有限的情況下,考慮通過(guò)算法模型優(yōu)化此問(wèn)題。
遮擋程度:五官無(wú)遮擋、臉部邊緣清晰的圖像為最佳。而在實(shí)際場(chǎng)景中,很多人臉都會(huì)被帽子、眼鏡、口罩等遮擋物遮擋,這部分?jǐn)?shù)據(jù)需要根據(jù)算法要求決定是否留用訓(xùn)練。
采集角度:人臉相對(duì)于攝像頭角度為正臉最佳。但實(shí)際場(chǎng)景中往往很難抓拍正臉。因此算法模型需訓(xùn)練包含左右側(cè)人臉、上下側(cè)人臉的數(shù)據(jù)。工業(yè)施工上攝像頭安置的角度,需滿足人臉與攝像頭構(gòu)成的角度在算法識(shí)別范圍內(nèi)的要求。
2)人臉檢測(cè):
(1)簡(jiǎn)介:
在圖像中準(zhǔn)確標(biāo)定出人臉的位置和大小,并把其中有用的信息挑出來(lái)(如直方圖特征、顏色特征、模板特征、結(jié)構(gòu)特征及Haar特征等),然后利用信息來(lái)達(dá)到人臉檢測(cè)的目的。
(2)人臉關(guān)鍵點(diǎn)檢測(cè)(人臉對(duì)齊):
自動(dòng)估計(jì)人臉圖片上臉部特征點(diǎn)的坐標(biāo)。
(3)主流方法:
基于檢測(cè)出的特征采用Adaboost學(xué)習(xí)算法(一種用來(lái)分類的方法,它把一些比較弱的分類方法合在一起,組合出新的很強(qiáng)的分類方法)挑選出一些最能代表人臉的矩形特征(弱分類器),按照加權(quán)投票的方式將弱分類器構(gòu)造為一個(gè)強(qiáng)分類器,再將訓(xùn)練得到的若干強(qiáng)分類器串聯(lián)組成一個(gè)級(jí)聯(lián)結(jié)構(gòu)的層疊分類器,有效地提高分類器的檢測(cè)速度。
最近人臉檢測(cè)算法模型的流派包括三類及其之間的組合:viola-jones框架(性能一般速度尚可,適合移動(dòng)端、嵌入式上使用),dpm(速度較慢),cnn(性能不錯(cuò))。
3)人臉圖像預(yù)處理:
?。?)簡(jiǎn)介:
基于人臉檢測(cè)結(jié)果,對(duì)圖像進(jìn)行處理并最終服務(wù)于特征提取的過(guò)程。
?。?)原因:
系統(tǒng)獲取的原始圖像由于受到各種條件的限制和隨機(jī)干擾,往往不能直接使用,必須在圖像處理的早期階段對(duì)它進(jìn)行灰度矯正、噪聲過(guò)濾等圖像預(yù)處理。
?。?)主要預(yù)處理過(guò)程:
人臉對(duì)準(zhǔn)(得到人臉位置端正的圖像),人臉圖像的光線補(bǔ)償,灰度變換、直方圖均衡化、歸一化(取得尺寸一致,灰度取值范圍相同的標(biāo)準(zhǔn)化人臉圖像),幾何校正、中值濾波(圖片的平滑操作以消除噪聲)以及銳化等。
4)人臉特征提?。?br />
?。?)簡(jiǎn)介:
人臉識(shí)別系統(tǒng)可使用的特征通常分為視覺特征、像素統(tǒng)計(jì)特征、人臉圖像變換系數(shù)特征、人臉圖像代數(shù)特征等。人臉特征提取就是針對(duì)人臉的某些特征進(jìn)行的,也稱人臉表征,它是對(duì)人臉進(jìn)行特征建模的過(guò)程
(2)人臉特征提取的方法:
1、基于知識(shí)的表征方法(主要包括基于幾何特征法和模板匹配法):
根據(jù)人臉器官的形狀描述以及它們之間的距離特性來(lái)獲得有助于人臉?lè)诸惖奶卣鲾?shù)據(jù),其特征分量通常包括特征點(diǎn)間的歐氏距離、曲率、和角度等。人臉由眼睛、鼻子、嘴、下巴等局部構(gòu)成,對(duì)這些局部和他們之間結(jié)構(gòu)關(guān)系的幾何描述,可作為識(shí)別人臉的重要特征,這些特征被稱為幾何特征。
2、基于代數(shù)特征或統(tǒng)計(jì)學(xué)習(xí)的表征方法:
基于代數(shù)特征方法的基本思想是將人臉在空域內(nèi)的高維描述轉(zhuǎn)化為頻域或者其他空間內(nèi)的低維描述,其表征方法為線性投影表征方法和非線性投影表征方法。
基于線性投影的方法主要有主成分分析法或稱K-L變化、獨(dú)立成分分析法和Fisher線性判別分析法。非線性特征提取方法有兩個(gè)重要的分支:基于核的特征提取技術(shù)和以流形學(xué)習(xí)為主導(dǎo)的特征提取技術(shù)。
5)匹配與識(shí)別:
提取的人臉特征值數(shù)據(jù)與數(shù)據(jù)庫(kù)中存貯的特征模板進(jìn)行搜索匹配,通過(guò)設(shè)定一個(gè)閾值,將相似度與這一閾值進(jìn)行比較,來(lái)對(duì)人臉的身份信息進(jìn)行判斷。
3、人臉識(shí)別的主要方法
1)EigenFace(特征臉)
MIT實(shí)驗(yàn)室的特克(Turk)和潘特(Pentland)提出的“特征臉”方法無(wú)疑是這一時(shí)期內(nèi)最負(fù)盛名的人臉識(shí)別方法。其后的很多人臉識(shí)別技術(shù)都或多或少與特征臉有關(guān)系,現(xiàn)在特征臉已經(jīng)與歸一化的協(xié)相關(guān)量(NormalizedCorrelation)方法一道成為人臉識(shí)別的性能測(cè)試基準(zhǔn)算法。
//blog.csdn.net/zizi7/article/details/52757300(人臉識(shí)別特征臉?biāo)惴ㄎ臋n)
2)FisherFace(漁夫臉):
貝爾胡米爾(Belhumeur)等提出的Fisherface人臉識(shí)別方法是這一時(shí)期的另一重要成果。該方法首先采用主成分分析(PCA)對(duì)圖像表觀特征進(jìn)行降維。在此基礎(chǔ)上,采用線性判別分析(LDA)的方法變換降維后的主成分以期獲得“盡量大的類間散度和盡量小的類內(nèi)散度”。該方法目前仍然是主流的人臉識(shí)別方法之一,產(chǎn)生了很多不同的變種,比如零空間法、子空間判別模型、增強(qiáng)判別模型、直接的LDA判別方法以及近期的一些基于核學(xué)習(xí)的改進(jìn)策略。
https://blog.csdn.net/zizi7/article/details/52999432(FisherFace算法文檔)
3)EGM(彈性圖匹配)
其基本思想是用一個(gè)屬性圖來(lái)描述人臉:屬性圖的頂點(diǎn)代表面部關(guān)鍵特征點(diǎn),其屬性為相應(yīng)特征點(diǎn)處的多分辨率、多方向局部特征——Gabor變換12特征,稱為Jet;邊的屬性則為不同特征點(diǎn)之間的幾何關(guān)系。對(duì)任意輸入人臉圖像,彈性圖匹配通過(guò)一種優(yōu)化搜索策略來(lái)定位預(yù)先定義的若干面部關(guān)鍵特征點(diǎn),同時(shí)提取它們的Jet特征,得到輸入圖像的屬性圖。最后通過(guò)計(jì)算其與已知人臉屬性圖的相似度來(lái)完成識(shí)別過(guò)程。該方法的優(yōu)點(diǎn)是既保留了面部的全局結(jié)構(gòu)特征,也對(duì)人臉的關(guān)鍵局部特征進(jìn)行了建模。
https://blog.csdn.net/real_myth/article/details/44828219(彈性圖匹配算法文檔)
4)基于幾何特征的方法
幾何特征可以是眼、鼻、嘴等的形狀和它們之間的幾何關(guān)系(如相互之間的距離)。這些算法識(shí)別速度快,需要的內(nèi)存小,但識(shí)別率較低。
5)基于神經(jīng)網(wǎng)絡(luò)的方法
神經(jīng)網(wǎng)絡(luò)的輸入可以是降低分辨率的人臉圖像、局部區(qū)域的自相關(guān)函數(shù)、局部紋理的二階矩等。這類方法同樣需要較多的樣本進(jìn)行訓(xùn)練,而在許多應(yīng)用中,樣本數(shù)量是很有限的。
6)基于線段Hausdorff距離(LHD)的方法
心理學(xué)的研究表明,人類在識(shí)別輪廓圖(比如漫畫)的速度和準(zhǔn)確度上絲毫不比識(shí)別灰度圖差。LHD是基于從人臉灰度圖像中提取出來(lái)的線段圖的,它定義的是兩個(gè)線段集之間的距離,與眾不同的是,LHD并不建立不同線段集之間線段的一一對(duì)應(yīng)關(guān)系,因此它更能適應(yīng)線段圖之間的微小變化。實(shí)驗(yàn)結(jié)果表明,LHD在不同光照條件下和不同姿態(tài)情況下都有非常出色的表現(xiàn),但是它在大表情的情況下識(shí)別效果不好。
7)基于支持向量機(jī)(SVM)的方法
近年來(lái),支持向量機(jī)是統(tǒng)計(jì)模式識(shí)別領(lǐng)域的一個(gè)新的熱點(diǎn),它試圖使得學(xué)習(xí)機(jī)在經(jīng)驗(yàn)風(fēng)險(xiǎn)和泛化能力上達(dá)到一種妥協(xié),從而提高學(xué)習(xí)機(jī)的性能。支持向量機(jī)主要解決的是一個(gè)2分類問(wèn)題,它的基本思想是試圖把一個(gè)低維的線性不可分的問(wèn)題轉(zhuǎn)化成一個(gè)高維的線性可分的問(wèn)題。通常的實(shí)驗(yàn)結(jié)果表明SVM有較好的識(shí)別率,但是它需要大量的訓(xùn)練樣本(每類300個(gè)),這在實(shí)際應(yīng)用中往往是不現(xiàn)實(shí)的。而且支持向量機(jī)訓(xùn)練時(shí)間長(zhǎng),方法實(shí)現(xiàn)復(fù)雜,該函數(shù)的取法沒有統(tǒng)一的理論。
4、技術(shù)發(fā)展方向
1)結(jié)合三維信息:二維和三維信息融合使特征更加魯棒
2)多特征融合:?jiǎn)我惶卣麟y以應(yīng)對(duì)復(fù)雜的光照和姿態(tài)變化
3)大規(guī)模人臉比對(duì):面向海量數(shù)據(jù)的人臉比對(duì)與搜索
4)深度學(xué)習(xí):在大數(shù)據(jù)條件下充分發(fā)揮深度神經(jīng)網(wǎng)絡(luò)強(qiáng)大的學(xué)習(xí)能力
5、人臉識(shí)別數(shù)據(jù)庫(kù)
1)Yale人臉數(shù)據(jù)庫(kù)
2)ORL人臉數(shù)據(jù)庫(kù)
3)CMUPIE人臉數(shù)據(jù)庫(kù)
4)FERET人臉數(shù)據(jù)庫(kù)
5)MIT數(shù)據(jù)庫(kù)
6)BANCA人臉數(shù)據(jù)庫(kù)
7)CAS-PEAL人臉數(shù)據(jù)庫(kù)
8)JAFE表情數(shù)據(jù)庫(kù)
9)Cohn-Kanade表情數(shù)據(jù)庫(kù)
10)MMI表情數(shù)據(jù)庫(kù)
6、技術(shù)指標(biāo)
1)人臉檢測(cè)中的關(guān)鍵指標(biāo):
例子:在攝像頭某張抓拍圖像中,一共有100張人臉,算法檢測(cè)出80張人臉,其中75張是真實(shí)人臉,5張是把路標(biāo)誤識(shí)為人臉。
1、檢測(cè)率:識(shí)別正確的人臉/圖中所有的人臉。檢測(cè)率越高,代表檢測(cè)模型效果越好。
2、誤檢率:識(shí)別錯(cuò)誤的人臉/識(shí)別出來(lái)的人臉。誤檢率越低,代表檢測(cè)模型效果越好。
3、漏檢率:未識(shí)別出來(lái)的人臉/圖中所有的人臉。漏檢率越低,代表檢測(cè)模型效果越好。
4、速度:從采集圖像完成到人臉檢測(cè)完成的時(shí)間。時(shí)間約短,檢測(cè)模型效果越好。
在這個(gè)實(shí)際案例中:檢測(cè)率=75/100誤檢率=5/80漏檢率=(100-75)/100
2)人臉識(shí)別中的關(guān)鍵指標(biāo):
1000張樣本圖片里,共600張正樣本。相似度為0.9的圖片一共100張,其中正樣本為99張。雖然0.9閾值的正確率很高,為99/100;但是0.9閾值正確輸出的數(shù)量確很少,只有99/600。這樣很容易發(fā)生漏識(shí)的情況。
1、精確率(precision):識(shí)別為正確的樣本數(shù)/識(shí)別出來(lái)的樣本數(shù)=99/100
2、召回率(recall):識(shí)別為正確的樣本數(shù)/所有樣本中正確的數(shù)=99/600
3、錯(cuò)誤接受率/認(rèn)假率/誤識(shí)率(FARFalseAcceptRate):
1、定義:指將身份不同的兩張照片,判別為相同身份,越低越好
2、FAR=NFA/NIRA
3、式中NIRA代表的是類間測(cè)試次數(shù),既不同類別間的測(cè)試次數(shù),打比方如果有1000個(gè)識(shí)別模型,有1000個(gè)人要識(shí)別,而且每人只提供一個(gè)待識(shí)別的素材,那NIRA=1000*(1000-1)。NFA是錯(cuò)誤接受次數(shù)。
4、FAR決定了系統(tǒng)的安全性,F(xiàn)RR決定了系統(tǒng)的易用程度,在實(shí)際中,F(xiàn)AR對(duì)應(yīng)的風(fēng)險(xiǎn)遠(yuǎn)遠(yuǎn)高于FRR,因此,生物識(shí)別系統(tǒng)中,會(huì)將FAR設(shè)置為一個(gè)非常低的范圍,如萬(wàn)分之一甚至百萬(wàn)分之一,在FAR固定的條件下,F(xiàn)RR低于5%,這樣的系統(tǒng)才有實(shí)用價(jià)值。
4、錯(cuò)誤拒絕率/拒真率/拒識(shí)率(FRRFalseRejectRate):
1、定義:指將身份相同的兩張照片,判別為不同身份,越低越好
2、FRR=NFR/NGRA
3、上式中NFR是類內(nèi)測(cè)試次數(shù),既同類別內(nèi)的測(cè)試次數(shù),打比方如果有1000個(gè)識(shí)別模型,有1000個(gè)人要識(shí)別,而且每人只提供一個(gè)待識(shí)別的素材,那NIRA=1000,如果每個(gè)人提供N張圖片,那么NIRA=N*1000。NFR是錯(cuò)誤拒絕次數(shù)。