聲紋鑒定自動(dòng)識(shí)別系統(tǒng)介紹
隨著研究手段和工具的不斷改進(jìn),說(shuō)話人識(shí)別的研究逐漸擺脫了早期單純的人耳聽(tīng)辨模式。
Bell實(shí)驗(yàn)室的 L?G?Kesta用目視觀察語(yǔ)譜圖的方法進(jìn)行識(shí)別,并提出了“聲紋”的概念。
“聲紋鑒定與自動(dòng)識(shí)別技術(shù)研究”項(xiàng)目由公安部物證鑒定中心等單位完成,其主要研究成果是將聲紋自動(dòng)識(shí)別功能植入VS99語(yǔ)音工作站,該系統(tǒng)能對(duì)說(shuō)話人特征進(jìn)行自動(dòng)分析、判斷和語(yǔ)圖顯示及測(cè)量,并可結(jié)合專(zhuān)家鑒定以確定說(shuō)話人身份,適合于法庭科學(xué)實(shí)際應(yīng)用。本項(xiàng)目研制出當(dāng)前聲紋鑒定工作中非常實(shí)用的集聲譜儀和說(shuō)話人自動(dòng)識(shí)別系統(tǒng)為一體的語(yǔ)音工作站,大大提高了結(jié)論的準(zhǔn)確率,為聲紋鑒定提供了一個(gè)實(shí)用系統(tǒng)。
◆創(chuàng)新技術(shù):
1.抗噪聲處理
噪聲對(duì)檢驗(yàn)結(jié)果的影響是一個(gè)不可忽視的問(wèn)題。在本系統(tǒng)中對(duì)于非平穩(wěn)噪聲,研究人員提出了利用偶數(shù)幀段主分量特征輸入隱馬爾可夫模型(HMM)結(jié)合時(shí)間方向平滑處理的SS方法來(lái)提高噪聲環(huán)境下漢語(yǔ)連續(xù)語(yǔ)音識(shí)別系統(tǒng)魯棒性的方法,取得較好的識(shí)別結(jié)果。
2.語(yǔ)音端點(diǎn)檢測(cè)
端點(diǎn)檢測(cè)可以避免由噪音引起的誤動(dòng)作以及由噪音引起的誤識(shí)別,對(duì)于準(zhǔn)確檢測(cè)語(yǔ)音信號(hào)的起始、提高識(shí)別系統(tǒng)精度等有重要意義。采用傳統(tǒng)的語(yǔ)音端點(diǎn)檢測(cè)器SAD很容易造成語(yǔ)音激活的漏檢。另外,較大的干擾信號(hào),又有可能被當(dāng)成是語(yǔ)音的激活,造成語(yǔ)音激活的虛檢。為克服這一缺點(diǎn),研究人員采用一種基于相關(guān)性的語(yǔ)音激活檢測(cè)器,定義了一種有效的相關(guān)函數(shù),找到了判別門(mén)限設(shè)定方法以及防止漏檢和虛檢的方法。
3.識(shí)別算法
本系統(tǒng)采用的是基于GMM模型的優(yōu)化算法。
(1)改進(jìn)的GMM的模型訓(xùn)練方法
實(shí)驗(yàn)中發(fā)現(xiàn)EM算法存在出現(xiàn)奇異陣的重大缺陷,而最大似然估計(jì)(ML),雖然識(shí)別率比較低,但不會(huì)出現(xiàn)奇異陣。因此研究人員采用最大似然估計(jì)(ML)所得模型為初始模型,然后用EM算法中的每步的模型通過(guò)α值控制修正比例對(duì)其進(jìn)行修正,稱(chēng)為改進(jìn)EM算法。
(2)基于遺傳算法的GMM的模型優(yōu)化算法
研究人員對(duì)傳統(tǒng)的遺傳算法進(jìn)行了改進(jìn),用于GMM的參數(shù)優(yōu)化中,大大提高了模型的優(yōu)化程度。
(3)GMM的說(shuō)話人識(shí)別方法的優(yōu)化
研究人員提出了一種新的優(yōu)化的基于GMM的說(shuō)話人識(shí)別方案,該方案通過(guò)先對(duì)一次發(fā)音對(duì)應(yīng)一個(gè)模型的各幀似然度做一種特定變化然后再計(jì)算該音節(jié)總的似然度,也就是該音節(jié)對(duì)應(yīng)該模型的總的評(píng)分,記作Sc,與最大Sc所屬模型相對(duì)應(yīng)的說(shuō)話人即為目標(biāo)說(shuō)話人。
◆社會(huì)效益:
目前,公安部物證鑒定中心完成的國(guó)家“九五”攻關(guān)成果VS99語(yǔ)音工作站已經(jīng)在國(guó)內(nèi)普及,在實(shí)際辦案中發(fā)揮了重要作用。該項(xiàng)目是在VS99的基礎(chǔ)上增加自動(dòng)判別功能,從而進(jìn)一步提高辦案效率和鑒定的準(zhǔn)確率。
評(píng)論