基于支持向量機(jī)的車牌定位方法
3.1 特征提取
利用SVM自身結(jié)構(gòu)可以實(shí)現(xiàn)有效的特征提取,選擇直接提取像素灰度特征。圖像像素點(diǎn)之間不是孤立的,相互之間存在著相關(guān)性,體現(xiàn)了一種紋理。可以通過提取一些特定像素的灰度值作為整幅圖像的特征,同時(shí)減少了計(jì)算量。首先將每幅圖像切割成若干個(gè)N×N子塊,再將每一子塊標(biāo)注為牌照區(qū)域(+1)和非牌照區(qū)域(-1)兩類,然后使用圖1所示“米”字型模型提取像素灰度值(圖中陰影為要提取的像素點(diǎn))。這樣每幅子圖的特征維數(shù)由N×N減少到4N-3,提高了訓(xùn)練和分類速度。
3.2 SVM分類器
SVM分類器分為三層結(jié)構(gòu),結(jié)構(gòu)示意見圖2。輸入層的維數(shù)為子圖的特征維數(shù)4N-3,輸入值是灰度值。隱含層的維數(shù)是由訓(xùn)練獲得的支持向量決定,即由訓(xùn)練階段自動(dòng)獲得,而且二次規(guī)劃在凸集下的解是全局最優(yōu)解,避免陷入局部最小。隱含層計(jì)算輸入向量與支持向量之間的內(nèi)積,完成非線性映射,通過核函數(shù)一步來實(shí)現(xiàn)的。輸出層的輸出就是對(duì)隱層的輸出與權(quán)值ωi的乘積求和,權(quán)值aiyi也是在訓(xùn)練中獲得的。
SVM中研究最多的核函數(shù)主要有三類:多項(xiàng)式、徑向基函數(shù)(RBF)和多層Sigmoid神經(jīng)網(wǎng)絡(luò)。實(shí)驗(yàn)中使用的是多項(xiàng)式核函數(shù),形式為:
作為一種基于樣本學(xué)習(xí)的方法,我們希望訓(xùn)練樣本集盡可能地大,以獲得比較充分的代表性。然而考慮到實(shí)際的限制,這個(gè)尺寸又必須是適中的。因此,問題就是如何構(gòu)造一個(gè)全面又可行的訓(xùn)練樣本集。對(duì)于車牌定位問題,所有包含牌照區(qū)域的圖像可以作為正樣本,困難點(diǎn)是收集負(fù)樣本,因?yàn)閷?shí)際上存在太多的不包含牌照的圖像可以作為負(fù)樣本。如何在這些圖像中選取具有代表性的子集,實(shí)驗(yàn)中采用了一種叫“自舉”(bootstrap)的方法,他已被Sung和Poggio成功地應(yīng)用于人臉識(shí)別。主要思想就是一些負(fù)樣本(非牌照)是在訓(xùn)練中獲得而不是在訓(xùn)練以前,具體實(shí)現(xiàn)步驟如下:
(1)建立包含正樣本(牌照區(qū)域)和負(fù)樣本(非牌照區(qū)域)的訓(xùn)練集合N1;
(2)用N1訓(xùn)練SVM;
(3)用訓(xùn)練好的SVM分類器對(duì)隨機(jī)選取的非牌照樣本進(jìn)行分類測(cè)試,收集那些被錯(cuò)分為牌照的樣本;
(4)隨機(jī)選取20%的錯(cuò)分類樣本加入到訓(xùn)練集N1;
(5)重復(fù)(2)~(4)步直至沒有再發(fā)現(xiàn)錯(cuò)分的樣本;
(6)使用最終獲得的N1訓(xùn)練SVM。
評(píng)論