基于小波多尺度和熵在圖像字符特征提取方法的改進(jìn) 作者: 時(shí)間:2007-03-09 來源:網(wǎng)絡(luò) 加入技術(shù)交流群 掃碼加入和技術(shù)大咖面對(duì)面交流海量資料庫查詢 收藏 摘要:提出了一種基于小波和熵提取圖像字符特征的方法。該方法利用小波變換對(duì)圖像字符進(jìn)行多尺度分解,用marr零交叉邊緣檢測算子提取邊緣;用基于判別熵最小化提取每一尺度圖像的邊界特征,小波的“數(shù)字顯微鏡”的優(yōu)點(diǎn)與熵能確切地表達(dá)各類的交疊狀況且能直接表達(dá)錯(cuò)誤率的特征相結(jié)合。與其它方法相比,該方法提取的特征向量穩(wěn)定、識(shí)別率高、算法快,非常有利于分類,且特征提取的方法有人類視覺的特點(diǎn)。關(guān)鍵詞:多尺度分析 Marr邊緣檢測算子 判別熵 特征提取 在線簽名驗(yàn)證是通過計(jì)算機(jī)采集和驗(yàn)證個(gè)人簽名,從而實(shí)現(xiàn)無紙化辦公的一種技術(shù)[1]。其中,從采集到的視頻圖像中提取有效的字符特片是在線簽名驗(yàn)證系統(tǒng)的核心步驟。 隨著計(jì)算機(jī)和模式識(shí)別技術(shù)的迅速發(fā)展,出現(xiàn)了很多提取字符特征的方案,最具代表性的有邊緣描述法和矩描述法[2]。描述邊緣形狀的方法可用曲線擬合和傅立葉描述子方法。傅立葉描述子雖較好地描述了一封閉的圖像輪廓,但其特征很多,噪聲和量化誤差對(duì)具有較低幅值的系數(shù)影響較大。當(dāng)用FFT計(jì)算傅立葉系數(shù),必須將其邊界點(diǎn)的長度修成2的整數(shù)次冪,且其描述不具有三個(gè)(方向、位置、大小)不變性,不能直接用于目標(biāo)識(shí)別,必須進(jìn)行復(fù)雜的變換。這些都影響了它的使用。矩描述法就是利用圖像灰度分布的各階矩描述圖像灰度分布的特征。矩特征是定義在整個(gè)圖像空間上的一個(gè)二重積分,它同樣不具有三個(gè)不變性,使用時(shí)必須進(jìn)行歸一化處理。不變矩只是一種旋轉(zhuǎn)歸一化方法,必須結(jié)合大小,位置歸一化處理才有三個(gè)不變性。圖1雖然用這些特征進(jìn)行圖像識(shí)別取得了較為滿意的效果,但是,這些特征的定義都是相當(dāng)復(fù)雜的,運(yùn)算量很大,并且與人類認(rèn)知的機(jī)理也是完全不同的,不能直觀地理解。本文提出了一種將統(tǒng)計(jì)特征與結(jié)構(gòu)特征相結(jié)合的新思路,對(duì)字符圖像進(jìn)行小波多尺度分解,有效地抑制了圖像中的噪聲,充分反映了圖像結(jié)構(gòu)的精細(xì)特征;用基于判別熵最小化進(jìn)行特征提取能確切地表達(dá)各類的交疊狀況,且能直接表達(dá)錯(cuò)誤率,從而有效地提高識(shí)別率。 1 小波多尺度分解 為了尋找空間的L2的基,先從L2的某個(gè)子空間出發(fā),在這個(gè)子空間中先建立基底,然后利用簡單變換,把這個(gè)基底擴(kuò)充到空間L2上,以形成一組基。這就是多尺度分析方法[3][4]。 對(duì)于二維的情況,設(shè){V2J}jez是一個(gè)可分離的MRA:V2J=VjVj,其中{V2j}jez是L2(R2)的一個(gè)MRA,其尺度函數(shù)為¢是一維MRA{V2j}jez的實(shí)值尺度函數(shù),小波母函數(shù)采用Dabuechies[6]小波;相應(yīng)于二維尺度函數(shù)V2j=VjVj,定義三個(gè)函數(shù): 構(gòu)成子空間W2j的正交標(biāo)準(zhǔn)基,而它們的伸縮平移系(簡寫)為: 是L2(R2)的一個(gè)標(biāo)準(zhǔn)正交基。 在本系統(tǒng)中,通過與計(jì)算機(jī)相連的手寫板及電子筆將簽名采集到計(jì)算機(jī)并顯示在屏幕上。采集并輸入到計(jì)算機(jī)中的圖像是二維,本文中設(shè)要分解的圖像為f (x,y)ΕL2(R2)。為方便,設(shè)L2(R2)-V2N,即令fN是f在V2N的正交投影。這樣關(guān)于f的有限小波分解就是對(duì)fN的分解。由于: 假定{V2j}jez上的尺度函數(shù)Φj,Φj(x,y)=2jΦ(2jx,2jy)為二維MAR{V2j}jez的尺度函數(shù),小波函數(shù)ψ(α)j, α=1,2,3已分別由式(1)和式(2)給出,并由陣列{CNk1,k2},(k1,k1ΕZ2),使得: 其中,Cn,k1,k2= 同樣,有: 式中(6),j=N-1,Λ,N-M。fj是fN在f2j上的低通濾波信號(hào),而gαj, α=1,2,3是fN在W2j上的三個(gè)高通濾波細(xì)節(jié)。再設(shè)有限長序列{Pk1}、{Pk2}分別是平面(x,y)上x方向與y方向的高通濾波系數(shù),{gk1}與{gk2}分別是x方向與y方向的低通濾波系數(shù),則由式(6)得到: 上式中箭頭右部分是左部分的矩陣表示,其中CN是原始信號(hào)f(x,y)的分布陣列,Pr、Pc是分別對(duì)CN的行與列作低通濾波的算子,而Qr、Qc是分別對(duì)CN的行與列作高通濾波的算子。而進(jìn)一步地第j次分解應(yīng)為: 式(7)中,j=N-2, Λ,N-M。式(7)便是二維信號(hào)fN或CN的有限正交小波分解的Mallat塔式算法[5]。通過實(shí)驗(yàn),選用Daubechies 8小波能達(dá)到較好的分解效果。對(duì)采集進(jìn)入計(jì)算機(jī)的真實(shí)簽名與偽造簽名進(jìn)行小波分解,限于遍幅,本文只給出了真實(shí)簽名的一次分解圖,如圖書1所示。 通常在實(shí)驗(yàn)中,借助Matlab6.5將真假簽名的字符圖像通過兩個(gè)互補(bǔ)濾波器即低通濾波器和高通濾波器分別得到圖像的相似和細(xì)節(jié)部分。相似子圖主要是原始圖像的全局、低頻成分,而細(xì)節(jié)子圖通常是原始圖像的局部、高頻成分。細(xì)節(jié)子圖又包括水平子圖、斜向子圖和垂直子圖三部分。其中細(xì)節(jié)子圖經(jīng)過兩次濾波:水平方向允許低頻分量通過,而沿垂直方向允許高頻分量通過。這對(duì)橫向筆劃(灰度變化沿水平方向?yàn)榈皖l,沿垂直方向?yàn)楦哳l)是增強(qiáng),而對(duì)豎筆劃(灰度變化沿水平方向?yàn)楦哳l,沿垂直方向?yàn)榈皖l)是平滑。垂直方向和斜方向的像素按同樣的道理分別在垂直子圖和斜子圖中被突出表示。這種方向選擇性與人眼視覺特性相吻合,使建立在此基礎(chǔ)上的特征提以算法具有類視覺特性。圖22 零交叉邊緣算子 經(jīng)典的邊緣檢測算子有Sobel算子、Laplace算子、Marr算子等,近年來又有學(xué)者提出了廣義模糊算子[7]、形態(tài)學(xué)邊緣算[8]等。而Marr邊緣檢測算子▽2G被譽(yù)為最佳邊緣監(jiān)測器之一,所以本文采Marr算子。該算子的特點(diǎn)是利用高斯濾波器對(duì)圖像進(jìn)行平滑。二維高斯濾波器的響應(yīng)函數(shù)。設(shè)f(x,y)為二值圖像函數(shù),由線性系統(tǒng)中卷積和微分的可交換性,得▽2{G(x,y)хI(x,y)}={ ▽2G (x,y)} хI(x,y),即:對(duì)圖像的高斯平滑濾波與拉普拉斯微分運(yùn)算可結(jié)合成一個(gè)卷積子如下: 用上述算子卷積圖像,通過判斷符號(hào)的變化確定出零交叉點(diǎn)的位置,就是邊緣點(diǎn)。對(duì)小波一次分解后的真實(shí)簽名的處理結(jié)果如圖2所示。 通過圖2可以看出,Marr零交叉邊緣算子同時(shí)提取了強(qiáng)、弱邊緣,并且邊緣相對(duì)干凈,噪聲干擾少,連續(xù)性好。 3 基于判別熵最小化的特征提取 不同的類樣本占有不同的特征空間的區(qū)域,只要這些區(qū)域不相交疊,它們就可以分開。經(jīng)常用樣本間的平均距離作為特征提取的判據(jù)函數(shù)。重要的距離有Minkowski度量ΔM、歐氏距離δE、Chebychev距離δr、平方距離δQ和非線性度量δN等。在不考慮各類的概率分布時(shí),不能確切地表達(dá)各類的交疊狀況,且不能直接表達(dá)錯(cuò)誤率。為此,應(yīng)考慮概率距離,利用不確定性最小的分征進(jìn)行分類是最有利的,故可用熵來度量后驗(yàn)證概率分布的集中程序。 某此概率分布密度偏離給定標(biāo)準(zhǔn)分布的程度的度量,叫相對(duì)熵。本文假定經(jīng)小波和Marr算子處理后的圖像函數(shù)?(xi,yj)的概率分布為P(xi,yj),給定標(biāo)準(zhǔn)分布ω(xi,yj),則兩者之間的相對(duì)熵為: 求和應(yīng)在該特征所有可能的取值上進(jìn)行。 相對(duì)熵越小,這兩類概率分布的差別就越大,當(dāng)兩類概率分別完全相同時(shí),相對(duì)熵達(dá)最大值(等于零)。因此可以定義判別熵W(p,q)來表征兩類分布p(xi,yj)和q(xi,yi)的差別大小。 在多類情況下,可以用ΣnΣmW(p(n),q(m))表示各類分布之間的分離程度。這里n,m代表類別號(hào)。 對(duì)特征提取來說,在給定維數(shù)d的條件下,求得這樣d個(gè)特征,它使上述判別熵最小。為了計(jì)算方便,本文用下列函數(shù)-U(p,q)= ΣiΣj(pi,j-qij)2≤0代替W(p,q),而不影響選取d個(gè)最優(yōu)特征的結(jié)果。 在不對(duì)概率分布作估計(jì)的情況下,可以用經(jīng)過歸一化處理的樣本特征值代替上式中的概率分布。 K是第一類樣本集中的樣本號(hào),N1是第一類的樣本總數(shù),i是特征號(hào)。由于,這樣做是合理的。而U取最小值的坐標(biāo)系統(tǒng)工程是由矩陣A=G(1)-G(2)滿足一定條件的d個(gè)本征值相應(yīng)的本征向量組成的。這里G(1)和G(2)分別是第一類樣本集和第二類本集的協(xié)方差矩陣。即將矩陣A的本征向量uk對(duì)應(yīng)的本征值λk,k=1,2,ΛD排隊(duì):選取本征值對(duì)應(yīng)的本征向量為所要求的坐標(biāo)軸系統(tǒng),在這個(gè)坐標(biāo)系統(tǒng)中判別熵最小。在實(shí)驗(yàn)中選取Shannon熵。表1和表2分別列出了真實(shí)簽名和偽造簽名分解后的各尺度圖像的最小判別熵。 由表1和表2的計(jì)算數(shù)據(jù)可以看出,通過小波一次分解后的最小判別熵的數(shù)據(jù)可以很明顯地對(duì)真假簽名進(jìn)行鑒別。并且,相似圖形與細(xì)節(jié)圖形的最小判別熵相差甚遠(yuǎn),區(qū)別較大;而細(xì)節(jié)圖形中的水平子圖、斜向子圖和垂直子圖三部分的最小判別熵卻相差較小。因此,這樣提取的特征向量穩(wěn)定性好、區(qū)別性大、正確性高。表1 真實(shí)簽名最小判別熵 相似圖形 水平子圖 斜線子圖 垂直子圖 相似圖形 0.0000 56.7827 58.371 60.5942 水平子圖 58.371 0.0000 1.5883 3.8115 斜線子圖 56.7827 1.5883 0.0000 2.2232 垂直子圖 60.5942 3.8115 2.2232 0.0000 表2 偽造簽名最小判別熵 相似圖形 水平子圖 斜線子圖 垂直子圖 相似圖形 0.0000 101.5640 126.6594 149.2631 水平子圖 101.5640 0.0000 25.0954 47.6991 斜線子圖 126.6594 25.0954 0.0000 22.6037 垂直子圖 149.25631 47.6991 22.6037 0.0000 4 實(shí)驗(yàn)結(jié)論 對(duì)120個(gè)不同的真實(shí)簽名進(jìn)行了實(shí)驗(yàn),且每份真實(shí)簽名對(duì)應(yīng)20個(gè)不同的偽造簽名,用小波分別對(duì)這些簽名圖像進(jìn)行6次分解,各選取其中的256幅圖像,分別進(jìn)行邊緣連接及最小化判別熵特征提取,鑒別率達(dá)到了98.7%,取得了令人滿意的結(jié)果。通過以上的理論分析和實(shí)驗(yàn)驗(yàn)證說明,用小波分解使原來單一的時(shí)域信號(hào)分解為不同頻率尺度下的信號(hào)不僅能獲得圖像在各尺度上的細(xì)節(jié)信息,且噪聲干擾少,邊緣清晰;在特征提取時(shí)用熵函數(shù)的期望值表征類別的分離程度,可以作為分類有效性的評(píng)價(jià)。該方法的優(yōu)越性對(duì)提高在線簽名驗(yàn)證的精確性具有重要的意義。 低通濾波器相關(guān)文章:低通濾波器原理 高通濾波器相關(guān)文章:高通濾波器原理
評(píng)論