基于DSP的語音識別計算器設計
摘要:為解決特殊群體使用計算器困難的問題,設計了一種基于TMS320VC5509 DSP的可語音識別的計算器系統(tǒng)。該計算器系統(tǒng)的核心是采用HMM算法建立語音識別模型。通過對實時語音信號(數字、運算符號等語音)進行處理,將得到的參數與模板庫參數進行匹配并加以識別,利用TMS320VC5509 DSP自帶的計算模塊實現語音信號整數100以內的加、減、乘、除等計算功能。實驗結果表明,該計算器系統(tǒng)在低噪聲場合和高噪聲場合下識別率分別達到94.73%和76.55%。
關鍵詞:語音識別;DSP;HMM;計算器;TMS320VC5509
隨著電子技術的高速發(fā)展,現代普通民用計算器在保留基本的加減乘除等運算外,加入了大量如三角函數、冪函數等比較復雜的運算。但是其基本的操作沒有發(fā)生變化,依然是運用手指操作,對于需要進行實時數字計算的一些特殊人群(殘疾人士)或是在一些特殊場合在無法手動操作計算器的情況下,用加入了語音識別模塊的計算器來進行實時數字計算就有相當的必要。
語音識別技術是人機最自然、最簡潔的交流方式,它就是讓機器能夠自動識別并理解說話人要表達的意思,將語音信號轉變?yōu)檎_的文本或者命令的高科技技術。根據實際的應用,語音識別可以分為:特定人與非特定人的識別、孤立詞與連續(xù)詞的識別、中小詞匯量與無限詞匯量的識別。
考慮到成本及使用范圍因素,本文中應用的是基于TMS320VC5509 DSP的非特定人、孤立詞、小詞匯量的語音識別系統(tǒng)。通過實際測試,使用該DSP的語音識別系統(tǒng)有著較高的實時性、識別率,基于該系統(tǒng)的計算器對實時數字計算有較高準確性,基本能解決特殊群體和特殊地點使用計算器困難的情況。
1 系統(tǒng)硬件設計
1.1 語音識別系統(tǒng)
語音識別的基本原理框圖如圖l所示。語音識別過程主要包括語音信號前處理、特征提取、模式匹配等部分。語音信號輸入之后,預處理和數字化是進行語音識別的前提條件。特征提取是進行語音信號訓練和識別必不可少的步驟,本文采用的是提取每幀的Mel系數的倒譜參數作為語音信號的特征值。模板匹配算法目前有DTW算法、HMM隱馬爾科夫模型、ANN人工神經網絡等。本文采用HMM隱馬爾科夫模型的方法,提取出的特征值存入參考模式庫中,用來匹配待識別語音信號的特征值。匹配計算是進行語音識別的核心部分,由待識別人的語音經過特征提取后,與系統(tǒng)訓練時產生的模板進行匹配,在說話人辨認中,取與待識別語音相似度最大的模型所對應的語音作為識別結果。
1.2 系統(tǒng)硬件結構
圖2為系統(tǒng)硬件結構框圖。此系統(tǒng)的核心器件是TI公司的TMS320VC5509定點DSP。在本系統(tǒng)中,它不僅是語音識別的核心,還負責計算器的運算部分。TMS320VC5509是系統(tǒng)的運算處理單元,具有2個乘法器(MAC),4個累加器(ACC);40位、16位的算術邏輯單元(ALU)各一個,這大大增強了DSP的運算能力;指令字長不只單一的16位,可擴展到最高48位,數據字長16位;可通過USB接口對TMS320VC5509燒寫程序而不必借助仿真器。正是基于這些優(yōu)點,選擇該器件可節(jié)省開發(fā)資金,減小電路板面積。DSP與TLV320AIC23的接口電路如圖3所示。
評論