一種邊緣檢測與掃描線相結(jié)合的車牌定位算法
摘要:提出了基于邊緣檢測的二值化與掃描線相結(jié)合的車牌定位方法。實驗表明該方法能夠快速、準(zhǔn)確地定位車牌,且抗干擾能力強(qiáng),定位準(zhǔn)確率在99%以上,光照和天氣對其定位結(jié)果影響很小。
車牌識別(LPR)技術(shù)是計算機(jī)視覺、圖像處理技術(shù)與模式識別技術(shù)的融合,是智能交通系統(tǒng)中一項非常重要的技術(shù)。一般說來,車牌識別前期的處理技術(shù)至關(guān)重要,其前期技術(shù)包括:車牌的定位、車牌圖像的二值化及字符分割。本文主要針對車牌定位算法進(jìn)行研究。
車牌定位就是在車輛圖像中定位牌照區(qū)域的位置。由于車輛圖像都采集于自然環(huán)境中,而在自然環(huán)境中車牌和背景的成像條件一般是不可控制的,隨機(jī)變化的因素(尤其是光照條件)和復(fù)雜的背景信息給目標(biāo)搜索帶來巨大困難。不同光照下,車牌的顏色、亮度、明蟬對比度都有很大變化;背景信息通常比車牌信息更加復(fù)雜,某些背景區(qū)域可能與車牌區(qū)域差異不大;再加上攝像距離、角度的不同,要從種種干擾中區(qū)別出目標(biāo)是十分困難的。而車牌區(qū)域在整幅圖像中所占的比例較小,要從整幅圖像中定位車牌區(qū)域必然要在大量的背景信息中搜索,而且由于應(yīng)用的特殊性,要求快速、準(zhǔn)確地完成車牌定位。如果沒有高效率的搜索方法,就需要耗費很多計算時間和存儲空間。所以車牌定位技術(shù)一直以來是一個難點,是車牌識別系統(tǒng)的一個關(guān)鍵技術(shù)環(huán)節(jié)。
目前,已經(jīng)提出了很多車牌定位的方法這些方法都具有一個共同的出發(fā)點即通過牌照區(qū)域的特征來判斷牌照。根據(jù)不同的實現(xiàn)方法,大致可以把現(xiàn)有的定位方法分為兩類:直接法、間接法。
(1)直接法:直接分析圖像的特征。例如,文獻(xiàn)提出一種基于線模板的二值化圖像中的角檢測算法。該算法利用車牌的邊框角點,檢測車牌的四個角點,并以此來定位車牌。文件介紹一種基于直線邊緣識別的圖像區(qū)域定位算法,并且利用該算法定位車牌的邊框線,以此定位車牌。文件介紹利用車牌的尺寸、字符間距、字符特征等紋理特征定位車牌。文件利用車牌部分垂直高頻豐富的特點先利用小波提取圖像的垂直高頻信息,然后利用數(shù)學(xué)形態(tài)學(xué)方法對小波分解后的細(xì)節(jié)圖像進(jìn)行一系列的形態(tài)運算,進(jìn)一步消除無用的信息和噪聲,以定位車牌。
(2)間接法:主要是指利用神經(jīng)網(wǎng)絡(luò)法或者遺傳算法定位車牌的方法。利用神經(jīng)網(wǎng)絡(luò)和遺傳算法等柔性方法進(jìn)行計算是當(dāng)前研究熱點之一。文獻(xiàn)提出利用BP神經(jīng)網(wǎng)絡(luò)定位車牌,文件提出利用DTCNN(Discrete-Time Cellular Neural Network)和模糊邏輯結(jié)合的方法。文獻(xiàn)利用多層感知器網(wǎng)絡(luò)(MLPN)對車牌進(jìn)行定位。文獻(xiàn)提出利用遺傳算法定位車牌,它利用遺傳算法對圖像進(jìn)行優(yōu)化搜索,結(jié)合區(qū)域特征矢量構(gòu)造的適應(yīng)度函數(shù),最終尋找到車牌的版照區(qū)域的最佳定位參量。
通過分析和觀測得知,與汽車圖像中其他區(qū)域相比,車牌區(qū)域主要有以下特征:
(1)車牌字符區(qū)域中的垂直邊緣較水平邊緣相對密集,而車身其他部分(如保險杠等)的水平邊緣明顯,垂直邊緣較少。另外,車牌一般懸掛在車身上較低的位置,其下方基本上沒有明顯的邊緣密集區(qū)域。
(2)有明顯的邊框,在其內(nèi)部規(guī)則地排列著一系列的省名縮寫(漢字)、地區(qū)代號(英文字母)和5位字母/數(shù)字編號(普通民用車輛)。底牌與字符的顏色主要有藍(lán)底白字、黃底黑字、黑底白字和白底黑字(或紅字)四種。隨拍攝角度和車牌自身污損程度的不同,所采集到的車牌邊框經(jīng)常出現(xiàn)傾斜、斷裂等現(xiàn)象。
因此直接定位法是利用邊框特性(利用特征2)以模模匹配的方法尋找牌照的四個角來定位或者尋找車牌邊框直線定位車牌以及利用牌照區(qū)域的灰度變化頻率(利用特征1)來定位。
1 車牌定位的預(yù)處理
圖像預(yù)處理的作用是突出圖像中的有用信息,不同的圖像預(yù)處理對應(yīng)于不同的圖像分割以獲得最佳的車牌特征。車牌定位預(yù)處理目睥是突出車牌區(qū)域的特征,抑制其它無用的特征。車牌定位預(yù)處理目的是突出車牌區(qū)域的特片,抑制其它無用的特征。車牌區(qū)域的主要特征之一是垂直邊緣較密集。所以本文提出增強(qiáng)垂直邊緣的差分算子進(jìn)行垂直邊緣增強(qiáng)。
為了不失一般性,本文對灰度圖像進(jìn)行研究。由于本文采集的圖像是彩色圖像,所以要把彩色圖像轉(zhuǎn)化為灰度圖像。為了減少不必要的彩色-灰度轉(zhuǎn)化的運算,本文只對輸入的彩色汽車圖像的綠色分量作處理。
邊緣檢測的算子很多。例如:如Sobel算子、Roberts算子、Prewitt算子、Laplacian算子等。Sobel、Roberts、Prewitt、Laplacian算子都不是專門用于檢測垂直邊緣的,且運算量較大。雖然可以只用它們的垂直邊緣檢測算子,但是相對而言,運算量還是比較大。為此,本文專門設(shè)計了一個水平模板算子,即[1,1,1…,1,1,1,1]。該算子與圖像進(jìn)行卷積然后再與原圖像作差分運算,當(dāng)差分值大于某一門限值就認(rèn)為它是邊緣目標(biāo),否則是背景。
水平模板即[1,1,1…,1,1,1,1],它與圖像進(jìn)行卷積相當(dāng)于圖像水平方向進(jìn)行低通濾波,再與原圖像差分,其目的是突出圖像的垂直方向的高頻信息(相當(dāng)于對圖像進(jìn)行高通濾波)。由于該算子可以做增量運算,也就是在計算局部平均值時,先計算水平方向窗口內(nèi)各點之和,將前次運算的結(jié)果減去窗口最左邊點的值再加上右邊新一點的值。這樣可以減少求和運算次數(shù),所以其運算量比Sobel算子少。
算子描述如下:
1/n[111...1111]-[000...1000] (1)
式(1)的左半部分是水平模板,即[1,1,1…,1,1,1,1]與圖像進(jìn)行卷積,右半部分可理解為原始圖像。它們進(jìn)行差分是式(1)的運算結(jié)果。
由于可以做增量運算,所以算子的長度對運算量影不大。在這里取9,其目的是與字符筆劃的寬度相符。
從圖1可以看出:圖像進(jìn)行卷積然后再與原圖像作差分的數(shù)據(jù),只有車牌區(qū)域、車輪、車燈等灰度突變處值相對較高,而其它幾乎為零。通過對整幅圖像的處理,得到車輛圖像的二值化圖像如圖2(a),對差分圖像進(jìn)行二值化,結(jié)果如圖2(b)(其中閾值取10)。
2 車牌的預(yù)定位
2.1 長程濾波與顆粒濾波
(1)長程濾波
從圖2(b)可以看出預(yù)處理后很多邊緣點連接成長程帶狀曲線(特別是在車輪、車窗)。而車牌區(qū)域不會有這種情形。如果不作相應(yīng)處理,就會給車牌定位帶來干擾。因此,在定位前應(yīng)當(dāng)先作長程濾波。
長程濾波算法基于這樣的思想:如果許多點邊綴成一個長程曲線L,那么長程濾波器考察L在x方向和y方向的空域延展程度。如果超過閾值,即將所有屬于L的候選點從候選點集合中濾掉。
(2)顆泣濾波
長程濾波后,圖像中仍有許多候選點集結(jié)成小型的彼此分離的顆粒狀,而車牌區(qū)的候選點一般不會有這種情況。由此進(jìn)行了顆粒濾波處理,濾掉顆粒噪聲。
由此本文定義兩個模塊:擊不中模板、擊中模板,如圖3所示。只要擊中模板和圖像乘積大于一定閾值,而擊不中模板與圖像乘積小于一定閾值就把擊中模板內(nèi)的圖像全置為零。
顆粒濾波基于這樣的想法:對于某一個候選點顆粒狀集合,在它周圍一定存在一個小矩形區(qū)(矩形區(qū)的大小與所考察的顆粒粒度有關(guān)),這個小矩形區(qū)的四周,包含非常少的候選點(理想情況是沒有候選點)。那么,對全圖進(jìn)行小矩形區(qū)掃描,檢查矩形區(qū)周邊上的候選點個數(shù)是否小于閾值。如果小于,則認(rèn)為該矩形區(qū)內(nèi)的所有候選點形成了孤立的顆粒狀命令,抹去這些點,就達(dá)到了顆粒濾波的目的。由于顆粒大小不一,可以進(jìn)行若干次不同粒度的顆粒消抹。對圖2(b)進(jìn)行長程濾波與顆粒濾波后的處理結(jié)果如圖4所示。
本文利用了車牌字符的連續(xù)特性。車牌區(qū)域有連續(xù)7個字符,而且字符與字符之間的距離在一定范圍內(nèi)。本文定義從目標(biāo)到背景或者從背景到目標(biāo)為一個跳變。牌照區(qū)域相對于其它非車牌區(qū)域跳變多,而且間距在一定范圍內(nèi)和跳變次數(shù)大于一定次數(shù)。通常為14以上,因為車牌中今有7個字符,每個字符有兩個以上跳變,為了防止字符的斷裂、模糊、車牌傾斜等的影響,本文保守起見采用10。
因此本文掃描線在二值化圖像中掃描定位車牌(一般來說車牌都在車輛的下部,與車牌文字類似的文字干擾大多在上部),采用從左到右、從下到上的順序掃描。算法如下:
從下到上的順序掃描,對圖像的每一行進(jìn)行從右向左的掃描。
(1)碰到跳變點記錄下當(dāng)前位置,如果某行有連續(xù)10個跳變點以上,并且前一個跳變和后一個跳變點的距離在一定范圍內(nèi),就記錄下起始占烽終止點位置。
(2)如果連續(xù)有十行以下這樣的跳變點,并且相鄰上下行的起始點和終止點相鄰。就認(rèn)為該區(qū)域是車牌預(yù)選區(qū)域。圖5顯示一幅典型的車輛圖像的定位結(jié)果圖。
從定位結(jié)果看,本定位算法還適合車輛圖像中包含多車牌的情況,而且定位速度受多車牌影不大。雖然車燈和車上的字符(包括車牌、車燈等垂直邊緣豐富的區(qū)域,以及繳費車牌等)也可能定位為預(yù)選區(qū)域,但是由于它們大都在車牌的上方,本文又采用從下而上的方式對預(yù)選區(qū)域進(jìn)行篩選,所以對定位速度影響不大。在99%以上的情況下遇到的的第一個預(yù)選區(qū)域是車牌區(qū)域如圖6(a)、(c),很少有象圖6(b)的情況。基于這種情況,本文這樣設(shè)計定位策略:若要求實時處理,就只選取第一個預(yù)選區(qū)域,把它送入切分和識別模塊;如果不要求實時性,就可以把各個預(yù)選區(qū)域分別送入切分和識別模塊。同時對于2000式車牌(圖6(c)),本文算法也能準(zhǔn)確定位。對于2000式車牌中上排的字符,只能通過切分模塊反饋獲得車牌左右邊界的進(jìn)一步定位。
采用該方法對圖7進(jìn)行了牌照左右邊界確定,結(jié)果如圖8所示。白色矩形框,是車牌的預(yù)選區(qū)域??梢钥闯銎滠嚺婆c車燈粘連,根據(jù)預(yù)定位的長度比大于一定數(shù)值,就認(rèn)為車牌和車燈等區(qū)域粘連。運行上述算法,進(jìn)一步確定車牌左右邊界。結(jié)果如圖8所示。
3 實驗結(jié)果
部分車輛圖像定位結(jié)果如圖9所示。
①準(zhǔn)確性:實驗結(jié)果表明車牌定位的準(zhǔn)確性大于99%,車牌定位的區(qū)域在外界有干擾以及車牌傾斜時比車牌稍大。
②時間特性:根據(jù)車牌情況不同在VC環(huán)境下運行時間在0.1到0.15秒之間(128M內(nèi)存PIII 733)。
③適應(yīng)性:車牌的噪聲對定位沒有影響,在光照很強(qiáng)和光照很弱的情況下,都能提取出車牌的圖像。但對于車牌嚴(yán)重腿色的情況,由于檢測不到筆畫等的邊緣會導(dǎo)致定位失敗。
④其它特性:本定位算法適合車輛圖像中包含多車牌的情況,而且定位速度受多車牌影響不大(同時也可能出現(xiàn)定位錯誤的區(qū)域和車燈等垂直邊緣豐富的區(qū)域以及繳費車牌區(qū)域等,這可以在以后的切分和識別模塊進(jìn)行拋棄)。
評論