語音識別技術(shù)的研究與發(fā)展
4.5 支持向量機(jī)(SVM)
支持向量機(jī)是應(yīng)用統(tǒng)計學(xué)習(xí)理論的一種新的學(xué)習(xí)機(jī)模型,它采用結(jié)構(gòu)風(fēng)險最小化原理(SRM),有效克服了傳統(tǒng)經(jīng)驗風(fēng)險最小化方法的缺點,在解決小樣本、非線性及高維模式識別方面有許多優(yōu)越的性能[4]。其基本思想可以概括為:首先通過非線性變換將輸入空間變換到一個高維空間,然后在這個新空間中求取最優(yōu)線性分類面,而這種非線性變換是通過定義適當(dāng)?shù)膬?nèi)積函數(shù)實現(xiàn)的。目前,統(tǒng)計學(xué)習(xí)理論和支持向量機(jī)也是國際上機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點。
5 語音識別所面臨的問題
盡管語音識別取得很大成功,但是距離真正的人機(jī)自由交流還有很大的距離。例如,目前計算機(jī)還需要對用戶做大量訓(xùn)練才能更準(zhǔn)確識別,用戶的語音識別率也并不是盡如人意。主要難題有以下幾個方面:
(1)識別系統(tǒng)的適應(yīng)性差。主要體現(xiàn)在對環(huán)境依賴性強(qiáng),特別在高噪音環(huán)境下語音識別性能還不理想。
(2)語音識別系統(tǒng)從實驗室演示系統(tǒng)到商品的轉(zhuǎn)化過程中,還有許多具體問題需要解決。例如,識別速度、拒識等問題,還有連續(xù)語音中去除不必要語氣詞如“呃”、“啊”等語音的技術(shù)細(xì)節(jié)問題。
(3)語言學(xué)、生理學(xué)、心理學(xué)方面的研究成果已有不少,但如何把這些知識量化、建模并用于語音識別,還需要進(jìn)一步研究。
面對上面的困難,語音識別技術(shù)要做到真正成功,在任何環(huán)境中都能人機(jī)進(jìn)行自由地對話,不僅需要語音識別基礎(chǔ)理論的突破,更需要大量的實際工作的積累。
6 語音識別技術(shù)的前景展望
語音作為當(dāng)前通信系統(tǒng)中最自然的通信媒介,語音識別技術(shù)是非常重要的人機(jī)交互技術(shù)。隨著計算機(jī)和語音處理技術(shù)的發(fā)展,語音識別系統(tǒng)的實用性將進(jìn)一步提高。應(yīng)用語音的自動理解和翻譯,可消除人類相互交往的語言障礙。國外已有多種基于語音識別產(chǎn)品(如聲控?fù)芴栯娫?、語音記事本等)的應(yīng)用,基于特定任務(wù)和環(huán)境的聽寫機(jī)也已經(jīng)進(jìn)入應(yīng)用階段。這預(yù)示著語音識別技術(shù)有著非常廣泛的應(yīng)用領(lǐng)域和市場前景。隨著語音技術(shù)的進(jìn)步和通信技術(shù)的飛速發(fā)展,語音識別技術(shù)將為網(wǎng)上會議、商業(yè)管理、醫(yī)藥衛(wèi)生、教育培訓(xùn)等各個領(lǐng)域帶來極大的便利[5],其應(yīng)用和經(jīng)濟(jì)、社會效益前景非常良好。
參考文獻(xiàn)
[1] 王炳錫,屈丹,彭煊.實用語音識別基礎(chǔ)[M].北京:國防工業(yè)出版社,2005.
[2] 劉么和,宋庭新.語音識別與控制應(yīng)用技術(shù)[M].北京:科學(xué)出版社,2008.
[3] 詹新明,黃南山,楊燦.語音識別技術(shù)研究進(jìn)展[J].現(xiàn)代計算機(jī),2008,291(9):43-45.
[4] 柳春.語音識別技術(shù)研究進(jìn)展[J].甘肅科技,2008,24(9):41-43.
[5] 高新濤,陳乖麗.語音識別技術(shù)的發(fā)展現(xiàn)狀及應(yīng)用前景[J].甘肅科技縱橫,2007,36(4):13.
評論