色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

<address id="nykpx"><samp id="nykpx"><thead id="nykpx"></thead></samp></address>

新聞中心

EEPW首頁 > EDA/PCB > 設(shè)計應(yīng)用 > 基于片上系統(tǒng)SoC的孤立詞語音識別算法設(shè)計

基于片上系統(tǒng)SoC的孤立詞語音識別算法設(shè)計

作者：時間：2012-04-01 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

1. 引言

本文引用地址：http://cafeforensic.com/article/190560.htm

目前，嵌入式語音識別系統(tǒng)的實(shí)現(xiàn)主要通過單片機(jī)MCU和數(shù)字信號處理器DSP來實(shí)現(xiàn)[1]。但是單片機(jī)運(yùn)算速度慢，處理能力不高；雖然DSP處理速度很快，但是產(chǎn)品的成本很高，電源能量消耗也很大。因此，為了滿足嵌入式交互系統(tǒng)的體積越來越小、功能越來越強(qiáng)的苛刻需求，語音識別片上系統(tǒng)SoC（System on Chip）應(yīng)運(yùn)而生。

語音識別片上系統(tǒng)SoC本身就是一塊芯片，在單一芯片上集成了模擬語音模數(shù)轉(zhuǎn)換器ADC、數(shù)模轉(zhuǎn)換器DAC、信號采集和轉(zhuǎn)換、處理器、存儲器和I/O接口等，只要加上極少的電源就可以具有語音識別的功能，集成了聲音信息的采集、取樣、處理、分析和記憶。SoC具有片內(nèi)處理器和片內(nèi)總線，有著更靈活的應(yīng)用方式。它具有速度快，體積小，成本低，可擴(kuò)展性強(qiáng)等優(yōu)點(diǎn)，有著廣泛的應(yīng)用前景，已經(jīng)成為語音識別技術(shù)應(yīng)用發(fā)展的一個重要方向[2-3]。研究和開發(fā)應(yīng)用于片上系統(tǒng)SoC芯片的語音識別算法有著非常重要的意義。

2. 孤立詞語音識別系統(tǒng)

孤立詞語音識別系統(tǒng)應(yīng)用于嵌入式控制領(lǐng)域，例如數(shù)字家庭控制、車載語音控制和智能語音可控玩具等。在訓(xùn)練階段，用戶將每一個詞依次說一遍，并將計算得到的每一個詞所對應(yīng)的特征矢量序列作為模板存入模板庫中。在識別階段，將輸入語音的特征矢量序列依次與模板庫中的每一模板進(jìn)行相似度比較，將相似度最高者作為識別結(jié)果輸出。

3. 針對片上系統(tǒng)SOC的孤立詞語音識別算法設(shè)計

在SoC芯片中實(shí)現(xiàn)孤立詞語音識別系統(tǒng)，就要根據(jù)語音識別片上系統(tǒng)的特點(diǎn)，來進(jìn)行SoC的語音識別算法的選擇和設(shè)計。

首先是特征提取算法的選擇。MFCC算法考慮到了人的聽覺效果，能很好的表征語音信號，而且在噪聲環(huán)境下能取得很好的識別效果。而LPC系數(shù)主要是模擬人的發(fā)聲模型，對元音有較好的的描述能力，對輔音描述能力較差，抗噪聲性能也相對差一些。但是從算法的計算量來考慮，MFCC提取特征參數(shù)是LPCC 的10倍左右，通常在嵌入式系統(tǒng)下較難實(shí)現(xiàn)實(shí)時性。因此，選用LPCC算法。

模式匹配技術(shù)的選擇。隱馬爾柯夫模型HMM方法是用概率及統(tǒng)計學(xué)理論來對語音信號進(jìn)行分析與處理的，適用于大詞匯量、非特定人的語音識別系統(tǒng)。該算法對系統(tǒng)資源的要求較多。而動態(tài)時間規(guī)整技術(shù)DTW采用模板匹配法進(jìn)行相似度計算，是一個最為小巧的語音識別算法，系統(tǒng)開銷小，識別速度快，可有效節(jié)約系統(tǒng)資源，降低系統(tǒng)成本開支。由于嵌入式系統(tǒng)資源有限，語音命令識別系統(tǒng)所需要的詞匯量有限，所需識別的語音都是簡短的命令，模式匹配算法選擇DTW。

3.1 端點(diǎn)檢測算法設(shè)計

一個好的端點(diǎn)檢測算法可以在一定程度上提高系統(tǒng)的識別率。在雙門限端點(diǎn)檢測原理的基礎(chǔ)上，進(jìn)行語音端點(diǎn)檢測算法的設(shè)計。為了提高端點(diǎn)檢測的精度，采用短時能量E和短時過零率ZCR。

語音采樣頻率為8KHz，量化精度為16位，數(shù)字PCM碼首先經(jīng)過預(yù)加重濾波器H(z)=2-0.95z-1，再進(jìn)行分幀和加窗處理，每幀30ms，240點(diǎn)為一幀，幀移為80，窗函數(shù)采用Hamming窗。然后對每幀語音進(jìn)行歸一化處理，即把每點(diǎn)的值都除以所有語音幀中數(shù)值絕對值的最大值，把值的范圍從[-32767，32767]轉(zhuǎn)換到[-1，1]。

在實(shí)驗(yàn)中發(fā)現(xiàn)，雙門限端點(diǎn)檢測算法對于兩個漢字和三個漢字的語音命令端點(diǎn)檢測效果不好。以語音“開燈”為例，如圖1所示語音波形圖中，端點(diǎn)檢測只能檢測到第一個字。

圖1 改進(jìn)前對語音“開燈”的端點(diǎn)檢測

Fig2. the endpointing detection of speech “kaideng” before ameliorate

如果語音命令中兩個字的間隔過長，使用雙門限端點(diǎn)檢測方法會發(fā)生只檢測到第一個字的情況，在實(shí)際中“開燈”和“開門”等命令只提取了“開”字的語音，從而可能造成語音匹配的錯誤。

為避免該錯誤，采用的辦法是，把可容忍的靜音區(qū)間擴(kuò)大到15幀 (約150ms)。在雙門限的后一門限往后推遲15幀，如15幀內(nèi)一直沒有energy和ZCR超過最低門限，則認(rèn)為語音結(jié)束；如發(fā)現(xiàn)仍然有語音，則繼續(xù)算入在內(nèi)。

圖2 改進(jìn)后對語音“開燈”的端點(diǎn)檢測

Fig3. the endpointing detection of speech “kaideng” after ameliorate

改進(jìn)后，整個語音信號的端點(diǎn)檢測流程設(shè)計為四個階段：靜音、過渡段、語音段和語音結(jié)束。在靜音段，如果能量或過零率超越了低門限，就應(yīng)該開始標(biāo)記起始點(diǎn)，進(jìn)入過渡段。在過渡段中，由于參數(shù)的數(shù)值比較小，不能確信是否處于真正的語音段，因此只要兩個參數(shù)的數(shù)值都回落到低門限以下，就將當(dāng)前狀態(tài)恢復(fù)到靜音狀態(tài)。而如果在過渡段中兩個參數(shù)中的任一個超過了高門限，就可以確信進(jìn)入語音段。在語音段，如果兩個參數(shù)的數(shù)值降低到低門限以下，并且一直持續(xù)15幀，那么語音進(jìn)入停止。如果兩個參數(shù)的數(shù)值降低到低門限以下，但是并沒有持續(xù)到 15幀，后續(xù)又有語音段越過低門限，那么認(rèn)為語音還沒有結(jié)束。最后，如果檢測出的這段語音總長度小于可接受的最小的語音幀數(shù)(設(shè)為15幀)，則認(rèn)為是一段噪音而放棄。

采用改進(jìn)后的端點(diǎn)檢測算法，對于單個漢字或多個漢字的語音命令均識別常。圖2為語音“開燈”的端點(diǎn)檢測圖(兩條紅線以內(nèi)的部分為檢測出來的語音部分)。

上一頁 1 2 3 4 下一頁

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： SoC 片上系統(tǒng) 語音識別 算法設(shè)計

評論

相關(guān)推薦

MCU&SOC

資源下載義隆電子 MCU SOC FLASH EDA | 2007-02-09

現(xiàn)場可配置片上系統(tǒng)TA7V05的應(yīng)用研究

資源下載 ARM 片上系統(tǒng) 可配置系統(tǒng)邏輯矩陣 PWM TA7V05 | 2007-02-16

完美結(jié)合無線連接、人工智能和安全性的智能家居解決方案

消費(fèi)電子智能家居芯科科技 SoC 物聯(lián)網(wǎng)安全 | 2024-06-07

[討論]vxWorks與windows進(jìn)行socket通信

hnol | 2005-05-11

CC2431 - 低功耗射頻SOC

視頻 TI SoC CC2430 CC2431 | 2009-03-24

新一代語音識別：可徹底改變車內(nèi)體驗(yàn)的技術(shù)

汽車電子語音識別生物識別人工智能 | 2024-07-18

MXT8051 SoC開發(fā)系統(tǒng)的設(shè)計方法

視頻時代民芯 MCU MXT8051 SoC | 2009-06-05

2nm制程：四強(qiáng)爭霸，誰是炮灰？

EDA/PCB SoC | 2024-06-05

Altera開始量售1GHz SoC

wangying | 2013-09-26

高清一體機(jī)IPC SOC解決方案

設(shè)計方案 IPC SOC Hi3518A IP攝像機(jī) | 2015-01-26

泰凌微：公司發(fā)布新產(chǎn)品TLSR925x 系列 SoC

嵌入式系統(tǒng) 泰凌微 TLSR925x SoC | 2024-07-04

CC2431.CC2430及Zigbee應(yīng)用的片上系統(tǒng)(SOC)解決方案

視頻 TI Zigbee CC2431 CC2430 SOC | 2010-03-15

利用MEMS麥克風(fēng)陣列定位并識別音頻或語音信源的技術(shù)方案

設(shè)計方案 ARM處理器 MEMS STM32F4 語音識別 | 2015-03-23

基于STM32智能家居系統(tǒng)的設(shè)計與實(shí)現(xiàn)

設(shè)計方案 STM32 語音識別服務(wù)器智能家居 | 2015-03-21

ARM芯片的應(yīng)用和選型[芯片類]

資源下載 ARM MMU SOC RISC CPU 選型 | 2007-02-28

請教大蝦如何用select來實(shí)現(xiàn)對兩個socket的操作

raneelina | 2006-03-16

如何從處理器和加速器內(nèi)核中榨取最大性能？

嵌入式系統(tǒng) SoC | 2024-06-05

孤立詞語音識別系統(tǒng)的DSP實(shí)現(xiàn)

設(shè)計方案孤立詞 DSP 語音識別 | 2015-03-28

片上系統(tǒng)芯片設(shè)計與靜態(tài)時序分析

資源下載集成電路設(shè)計 SOC 靜態(tài)時序分析 | 2007-02-16

電視機(jī)智能聲控選合系統(tǒng)設(shè)計與實(shí)現(xiàn)

資源下載語音識別彩電遙控智能聲控選臺 | 2007-02-16

愛普科技與Mobiveil攜手開發(fā)UHS PSRAM控制器，提供SoC業(yè)者全新解決方案

EDA/PCB 愛普科技 Mobiveil UHS PSRAM 控制器 SoC | 2024-06-07

CC2530 片上系統(tǒng)視頻

視頻 TI Zigbee CC2530 SOC | 2010-03-15

連接世界的SOC設(shè)計

視頻 MIPS SOC | 2009-12-21

聯(lián)發(fā)科發(fā)布天璣 7350 芯片，CPU 大核 3.0 GHz

手機(jī)與無線通信聯(lián)發(fā)科天璣 SoC | 2024-07-17

imec 宣布牽頭建設(shè)亞 2nm 制程 NanoIC 中試線，項目將獲 25 億歐元資金支持

EDA/PCB 半導(dǎo)體 2nm SoC 制程 | 2024-05-21

Nuance語音識別技術(shù)

設(shè)計方案語音識別 Nuance 消費(fèi)電子 | 2015-02-03

晶心科技與Arteris攜手加速RISC-V SoC的采用

EDA/PCB 晶心科技 Arteris RISC-V SoC | 2024-05-28

關(guān)于Altera的SOC fpga

fengyelu | 2014-04-29

大家對于OR1200開源軟核有什么看法或見解？望交流

蘇凌云 | 2013-10-17

挑戰(zhàn)蘋果！曝谷歌自研Soc Tensor G5進(jìn)入流片階段：臺積電代工

手機(jī)與無線通信谷歌 Soc 臺積電 Pixel | 2024-07-05

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

<mark id="rfoat"></mark>

<blockquote id="rfoat"></blockquote>