基于OpenCV 的人臉檢測(cè)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
1.引言
OpenCV(Intel·Open Source Computer Vision Library)是Intel 公司面向應(yīng)用程序開發(fā)者開發(fā)的計(jì)算機(jī)視覺庫,其中包含大量的函數(shù)用來處理計(jì)算機(jī)視覺領(lǐng)域中常見的問題,例如運(yùn)動(dòng)分析和跟蹤、人臉識(shí)別、3D 重建和目標(biāo)識(shí)別等[1].可以通過訪問http://www.source- forge.net/projects/opencvlibrary 免費(fèi)獲得OpenCV 庫以及相關(guān)的資料。另外, 還可以通過訪問http://www.yahoogroups.com/group/OpenCV, 對(duì)于OpenCV使用中的一些問題與經(jīng)驗(yàn)進(jìn)行討論。
相對(duì)于其它圖像函數(shù)庫, OpenCV 是一種源碼開放式的函數(shù)庫, 開發(fā)者可以自由地調(diào)用函數(shù)庫中的相關(guān)處理函數(shù)。OpenCV 中包含300多個(gè)處理函數(shù)[1], 具備強(qiáng)大的圖像和矩陣運(yùn)算能力, 可以大大減少開發(fā)者的編程工作量, 有效提高開發(fā)效率和程序運(yùn)行的可靠性。另外, 由于OpenCV 具有很好的移植性, 開發(fā)者可以根據(jù)需要在MS-Windows 和Linux 兩種平臺(tái)進(jìn)行開發(fā)[2].
人臉檢測(cè)(Face Detection)是指在輸入圖像中確定所有人臉(如果存在)的位置、大小、位姿的過程。人臉檢測(cè)作為人臉信息處理中的一項(xiàng)關(guān)鍵技術(shù), 近年來成為模式識(shí)別與計(jì)算機(jī)視覺領(lǐng)域內(nèi)一項(xiàng)受到普遍重視、研究十分活躍的課題。人臉檢測(cè)問題最初來源于人臉識(shí)別(FaceRecognition)。人臉識(shí)別的研究可以追溯到上個(gè)世紀(jì)六、七十年代, 經(jīng)過幾十年的曲折發(fā)展已日趨成熟。人臉檢測(cè)是自動(dòng)人臉識(shí)別系統(tǒng)中的一個(gè)關(guān)鍵環(huán)節(jié), 但是早期的人臉識(shí)別研究主要針對(duì)具有較強(qiáng)約束條件的人臉圖像(如無背景的圖像), 往往假設(shè)人臉位置已知或很容易獲得, 因此人臉檢測(cè)問題并未受到重視。近幾年隨著電子商務(wù)等應(yīng)用的發(fā)展,人臉識(shí)別成為最有潛力的生物身份驗(yàn)證手段, 這種應(yīng)用背景要求自動(dòng)人臉識(shí)別系統(tǒng)能夠?qū)σ话阌纱怂媾R的一系列問題使得人臉檢測(cè)開始作為一個(gè)獨(dú)立的課題受到研究者的重視。今天, 人臉檢測(cè)的應(yīng)用背景已經(jīng)遠(yuǎn)遠(yuǎn)超出了人臉識(shí)別系統(tǒng)的范疇, 在基于內(nèi)容的檢索、數(shù)字視頻處理、視覺監(jiān)測(cè)等方面有著重要的應(yīng)用價(jià)值。
人臉檢測(cè)研究具有重要的學(xué)術(shù)價(jià)值。人臉是一類具有相當(dāng)復(fù)雜的細(xì)節(jié)變化的自然結(jié)構(gòu)目標(biāo), 此類目標(biāo)的檢測(cè)問題的挑戰(zhàn)性在于: (1)人臉由于外貌、表情、膚色等不同, 具有模式的可變性; (2)一般可能存在眼鏡、胡須等附屬物; (3)作為三維物體的人臉的影像不可避免地受由光照產(chǎn)生的陰影的影響。因此, 如果能夠找到解決這些問題的方法, 成功構(gòu)造出人臉檢測(cè)與跟蹤系統(tǒng), 將為解決其它類似的復(fù)雜模式檢測(cè)問題提供重要的啟示。
目前, 國外對(duì)人臉檢測(cè)問題的研究很多, 比較著名的有MIT, CMU等; 國內(nèi)的清華大學(xué)、北京工業(yè)大學(xué)、中科院計(jì)算所和自動(dòng)化所等都有人員從事人臉檢測(cè)相關(guān)的研究。而且, MPEG7 標(biāo)準(zhǔn)組織已經(jīng)建立了人臉識(shí)別草案小組, 人臉檢測(cè)算法也是一項(xiàng)征集的內(nèi)容。隨著人臉檢測(cè)研究的深入, 國際上發(fā)表的有關(guān)論文數(shù)量也大幅度增長。
2.系統(tǒng)設(shè)計(jì)
本文采用OpenCV 實(shí)現(xiàn)人臉檢測(cè)的原理是基于Adaboost 算法, 該算法是一種分類器算法, 其基本思想是利用大量的分類能力一般的簡(jiǎn)單分類器(Basic classifier)通過一定的方法疊加(boost)起來, 構(gòu)成一個(gè)分類能力很強(qiáng)的強(qiáng)分類器(Stage classifier), 再將若干個(gè)強(qiáng)分類器串聯(lián)成為分級(jí)分類器(classifier cascade)完成圖像搜索檢測(cè)。串聯(lián)的級(jí)數(shù)依賴于系統(tǒng)對(duì)錯(cuò)誤率和識(shí)別速度的要求。
本系統(tǒng)由訓(xùn)練和檢測(cè)兩個(gè)模塊完成, 兩部分的流程圖如圖1 和圖2 所示:
圖1 訓(xùn)練程序流程圖
圖2 檢測(cè)程序流程圖
3.系統(tǒng)實(shí)現(xiàn)
本系統(tǒng)采用Microsoft VC++編程工具實(shí)現(xiàn), 從OpenCV 官方網(wǎng)站上下載OpenCV 的最新版本后按照安裝說明安裝OpenCV 開發(fā)包, 并在VC++系統(tǒng)中配置好開發(fā)環(huán)境。系統(tǒng)中實(shí)現(xiàn)的主要檢測(cè)函數(shù)如下, 其中調(diào)用了OpenCV 函數(shù)庫中的部分函數(shù)。
CRect CFaceDetect::DetectAndDrawFaces( IplImage* img )
{
CRect rc(0,0,0,0);
if( m_pHidCascade img )
{
int scale = 2;
CvSize img_size = cvGetSize( img );
IplImage* temp = cvCreateImage ( cvSize (img_size.width/2,
img_size.height/2), 8, 3 );
int i;
cvPyrDown( img, temp );
cvClearMemStorage( m_pStorage );
if( m_pHidCascade )
{
CvSeq* faces = cvHaarDetectObjects ( temp,
m_pHidCascade, m_pStorage, 1.2, 2, 1 );
for( i = 0; i (faces ? faces- >total : 0); i++ )
{
CvRect r = *(CvRect*)cvGetSeqElem( faces, i );
cvRectangle( img,
cvPoint(r.x*scale, r.y*scale),
cvPoint ((r.x+r.width)*scale, (r.y+r.height)
*scale),
CV_RGB(255,0,0), 3 );
rc.left = r.x*scale;
rc.top = r.y*scale;
rc.right = (r.x+r.width)*scale;
rc.bottom = (r.y+r.height)*scale;
}
}
cvReleaseImage( temp );
}
return rc;
}
其中函數(shù)cvHaarDetectObjects 使用針對(duì)某目標(biāo)物體訓(xùn)練的級(jí)聯(lián)分類器在圖像中找到包含目標(biāo)物體的矩形區(qū)域, 并且將這些區(qū)域作為一序列的矩形框返回。函數(shù)以不同比例大小的掃描窗口對(duì)圖像進(jìn)行幾次搜索。每次都要對(duì)圖像中的這些重疊區(qū)域利用cvRunHaarClassifierCascade進(jìn)行檢測(cè)。有時(shí)候也會(huì)利用某些繼承(heuristics)技術(shù)以減少分析的候選區(qū)域, 例如利用Canny 裁減(pruning)方法。函數(shù)在處理和收集到候選的方框(全部通過級(jí)聯(lián)分類器各層的區(qū)域) 科之后, 接著對(duì)這些區(qū)域進(jìn)行組合并且返回一系列各個(gè)足夠大的組合中的平均矩形。調(diào)節(jié)程序中的缺省參數(shù)(scale_factor=1.1, min_neighbors=3,flags=0)用于對(duì)目標(biāo)進(jìn)行更精確同時(shí)也是耗時(shí)較長的進(jìn)一步檢測(cè)。為了能對(duì)視頻圖像進(jìn)行更快的實(shí)時(shí)檢測(cè), 參數(shù)設(shè)置通常是: scale_factor=1.2,min_neighbors=2, flags=CV_HAAR_DO_CANNY_PRUNING,min_size =minimumpossible face size.
4.結(jié)束語
通過編程實(shí)現(xiàn)人臉檢測(cè)系統(tǒng)表明, 應(yīng)用OpenCV 函數(shù)庫進(jìn)行圖像處理編程, 功能強(qiáng)大, 簡(jiǎn)捷高效, 可以使編程人員快速地實(shí)現(xiàn)算法。
OpenCV 確實(shí)為VC++編程處理數(shù)字圖像提供了極大的方便, 具有廣闊的應(yīng)用前景。
評(píng)論