字符結構知識在車牌識別中的應用
摘要:提出了一種完全基于結構知識的字符識別方法。該方法以字符的結構特點和筆畫類型、數(shù)據(jù)及位置作為識別特片生成判定時,再利用判定樹對汽車牌照中的字母和數(shù)字進行分類識別。
本文引用地址:http://cafeforensic.com/article/197339.htm汽車牌照識別是基于圖像分割和圖像識別理論,對含有汽車牌照的圖像進行分析處理,從而確定汽車牌照在圖像中的位置,并進一步提取和識別出文本字符。從不同車牌圖像中分割出的字符圖像各式各樣,尺寸變化范圍大,增加了識別的難度。盡管可以采用圖像變換方法將分割出的所有字符圖像歸一化為相同尺寸,但歸一化過程又不可避免地丟失有用的字符信息,造成圖像失真,無助于提高識別準確率,并且浪費時間,降低了識別速度。
本文通過分析汽車牌照的特點,提出了一種利用字符的筆畫特征和結構知識對汽車牌照中的字母和數(shù)字進行識別的方法。試驗表明,該方法識別速度快、準確率高,不受字符圖像大小影響,適應性強。
1 車牌字符結構和識別
中國大陸汽車牌照中使用的字符包括59個漢字、25個英文字母(字母I不用)和10個阿拉伯數(shù)字三種類型共94個,且都是印刷體,結構固定、筆畫規(guī)范。圖1是車牌號碼中使用的全部字母和數(shù)字的圖像。這些字符的結構在水平方向有三種類型:左右對稱、左大右小、左小右大。在豎直方向同樣有三種結構,即上下對稱、上大下小、上小下大。如車牌號碼中使用的數(shù)字8,就屬于左右對稱且上下對稱。
從圖1可以看出,全部字母和數(shù)字的筆畫共有兩大類:直筆畫和弧筆畫。直筆畫又可分為橫筆畫、豎筆畫、左斜筆畫(相當于漢字筆畫中的撇)和右斜筆畫(相當于漢字筆畫中的捺)?;」P畫是一條曲線段,本文將其分為兩類:開弧筆畫和閉弧筆畫。所謂開弧筆畫,指該弧筆畫沒有形成封閉環(huán),如字母C。而閉弧筆畫則形成一個封閉的環(huán),如數(shù)字0。
根據(jù)字符圖像的這一特點,本文采用下述方法對字母和數(shù)字進行逐級分類,形成一棵識別判定樹,每個字符就是一個葉子:
(1)首先在待識別的字符圖像中搜索封閉環(huán)的數(shù)量和位置。
(2)根據(jù)搜索到封閉環(huán)的結果判斷字符所在的類封閉環(huán)字符類、雙封閉環(huán)字符類、無封閉環(huán)字符類。 (3)針對每一類分別進行處理。
(4)雙封閉環(huán)字符只有8和B,因此只要抽取豎筆畫即可區(qū)分出這兩個字符。B的左半部分有一長豎,而8沒有。
(5)單封閉環(huán)的字符有A、D、O、P、Q、R、0、4、6和9。根據(jù)封閉環(huán)的位置將這些字符分成三類:封閉環(huán)在上部;封閉環(huán)在下部和封閉環(huán)在中間,然后再根據(jù)結構特點和抽取的筆畫特征進行識別。
.封閉環(huán)在上部的字符有P、R和9。如果待識別字符圖像上半部分有一個封閉環(huán),則從左半部分抽取豎筆畫;若左側部分沒有豎筆畫,則該字符為9;若在左半部分抽取到豎筆畫,繼續(xù)抽取右斜筆畫;抽取到右斜筆畫,該字符為R;否則為P。
.封閉環(huán)在下部的字符有A、4和6。如果待識別字符圖像下半部分有一個封閉環(huán),則從右半部分抽取豎筆畫;若右側部分有豎筆畫,則該字符為4;若在右半部分沒有抽取到豎筆畫,繼續(xù)抽取橫筆畫;抽取到橫筆畫,該字符為A;否則為6。
.封閉環(huán)在中間的字符有D、O、Q和0。實際應用中,O和0的圖像完全相同,可以作為同一個字符處理。如果待識別字符圖像中間有一個封閉環(huán),則首先利用上下對稱特點判斷是否為Q;若上下對稱,則為0(O)或D;然后按照左右對稱特征區(qū)分字符0和D。
(6)無封閉環(huán)的字符有C、E、F、C、H、J、K、L、M、N、S、T、U、V、W、X、
Y、Z、l、2、3、5和7,通過抽取筆畫對這些字符進行識別,具體步驟如下:
· 抽取橫筆畫和豎筆畫。
· 若待識別字符圖像沒有橫筆畫和豎筆畫,則該字符為S、V或X。
· 若待識別字符圖像只有橫筆畫而沒有豎筆畫,則該字符為2、3、7或Z。
· 若待識別字符圖像只有豎筆畫而沒有橫筆畫,則該字符為1、C、J、K、M、N、U、W''或Y。
· 待識別字符圖像既有橫筆畫又有豎筆畫的字符為5、E、F、C、H、l或T。
.S、V和X的識別。抽取左斜筆畫和右斜筆畫,S沒有這兩種筆畫,從而可識別出S。X的兩條斜筆畫交點位于字符圖像的中間位置,而V的兩條斜筆畫相交于字符圖像的下部,以此識別X和V。
· 識別2、3、7和Z。這四個字符中只有Z有兩條橫筆畫,從而可以此識別出Z。3和7的橫筆畫都位于上部,而2的橫筆畫位于下部,這樣又可以識別出2。對于3和7,利用左斜筆畫進行識別。7具有左斜筆畫,而3沒有。
·識別1、C、J、K、M、N、U、W和Y。根據(jù)豎筆畫的數(shù)量將這些字符分為三類,1、 C、J、K和Y都是一條豎筆畫、M、N和U是兩條豎筆畫,而W有三條豎筆畫,這樣就完成了W的識別。
評論