色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

<td id="uo4gc"></td>

新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設計應用 > LD3320嵌入式語音識別系統(tǒng)應用

LD3320嵌入式語音識別系統(tǒng)應用

作者：時間：2016-09-12 來源：網(wǎng)絡

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

收藏

1 概述

本文引用地址：http://cafeforensic.com/article/201609/303656.htm

語音交互系統(tǒng)是比較人性化的人機操作界面，它需要語音識別系統(tǒng)的支持。LD3320就是這樣一款語音識別芯片。介紹了該芯片的工作原理及應用，給出了LD3320與微處理器的硬件接口電路及軟件程序。隨著高檔MCU的不斷出現(xiàn)，以MCU為核心的嵌入式語音交互系統(tǒng)會有非常好的應用前景。

2 特定人語音識別技術及原理

特定人語音識別(ASR,Auto Speech RecognitiON)技術是基于關鍵詞語列表的識別技術，它是對大量的語音數(shù)據(jù)(相當于對數(shù)千人采集的數(shù)萬小時的有效聲音數(shù)據(jù))經(jīng)語言學家語音模型分析，建立數(shù)學模型，并經(jīng)過反復訓練提取基元語音的細節(jié)特征，以及提取各基元間的特征差異，得到在統(tǒng)計概率最優(yōu)化意義上的各個基元語音特征，最后才由資深工程師將算法以及語音模型轉(zhuǎn)換成硬件芯片并應用在嵌入式系統(tǒng)中。

ASR技術每次識別的過程就是把用戶說出的語音內(nèi)容，通過頻譜轉(zhuǎn)換為語音特征，再將這個轉(zhuǎn)換后的語音特征和關鍵詞語列表中的條目一一進行匹配，最優(yōu)匹配的一條即作為識別結(jié)果。比如ASR技術在語音控制的手機應用中，這個關鍵詞語列表的內(nèi)容就是電話本中的人名、手機的菜單命令或手機存儲卡中的歌曲名字。不論這個列表的條目內(nèi)容是什么，只需要用戶設置相關的寄存器，就可以把相應的待識別條目內(nèi)容以字符形式傳遞給識別引擎。

由此可見，語音識別芯片完成的工作就是：把MIC(麥克風)輸入的聲音進行頻譜分析后提取語音特征，再和關鍵詞語列表中的關鍵詞語進行對比匹配，最后找出得分最高的關鍵詞語作為識別結(jié)果輸出。

通?；贏SR技術的語音識別芯片能在兩種情況下給出識別結(jié)果：

①外部送入預定時間的語音數(shù)據(jù)(比如5 s的語音數(shù)據(jù))，芯片對這些語音數(shù)據(jù)運算分析后，給出識別結(jié)果。

②外部送入語音數(shù)據(jù)流，語音識別芯片通過端點檢測(VAD,Voice Activity Detection)技術檢測出用戶停止說話，把用戶開始說話到停止說話之間的語音數(shù)據(jù)進行運算分析后，給出識別結(jié)果。

對于第一種情況，可以理解為設定了一個定時錄音(如5 s的語音數(shù)據(jù))，芯片在5 s后會停止把聲音送入識別引擎，并且根據(jù)已送入引擎的語音數(shù)據(jù)計算出識別結(jié)果。

對于第二種情況，需要了解VAD的工作原理：VAD技術是在一段語音數(shù)據(jù)流中，判斷出哪個時間點是人聲音的開始，哪個時間點是人聲音的結(jié)束。判斷的依據(jù)是，在背景聲音的基礎上有了語音發(fā)音，則視為聲音的開始。而后，檢測到一段持續(xù)時間的背景音(比如600 ms)，則視為人聲說話結(jié)束。通過VAD判斷出人聲說話的區(qū)域后，語音識別芯片會把這期間的聲音數(shù)據(jù)進行識別處理，計算出識別結(jié)果。

除了以上兩種情況外，語音識別算法無法主動地判斷出是否識別出了一個結(jié)果。這是因為，在計算過程中的任何時刻，語音識別器都會對已送人識別芯片的聲音數(shù)據(jù)進行分析，并根據(jù)匹配程度為識別列表中的關鍵詞語進行打分，最匹配的打分最高。但是，由于識別算法不知道用戶后面是否還繼續(xù)說話，所以無法主動地判斷已經(jīng)識別出的結(jié)果。

3 語音識別芯片LD3320的工作原理

3.1 語音識別系統(tǒng)原理結(jié)構(gòu)

LD3320語音識別芯片采用的就是ASR技術，圖1就是由LD3320和單片機(或嵌入式系統(tǒng))組成的語音識別系統(tǒng)原理框圖。圖中給出了LD3320的內(nèi)部原理結(jié)構(gòu)，本文中選用的MCU是STC10L08XE單片機。

圖1 語音識別系統(tǒng)原理框圖

語音識別芯片LD3320是ICRoute公司的產(chǎn)品，它采用ASR技術，提供了一種脫離按鍵、鍵盤、鼠標、觸摸屏等GUI操作方式且基于語音的用戶界面VUI(Voice User Interface)，使得用戶對該系統(tǒng)的操作更簡單、快速和自然。

用戶只需要把識別的關鍵詞語以字符串的形式傳送進芯片，即可以在下次識別中立即生效。比如，用戶在51等主控MCU的編程中，簡單地通過設置芯片的寄存器，把諸如你好這樣的識別關鍵詞語的內(nèi)容動態(tài)地傳入芯片中，芯片就可以識別所設定的關鍵詞語了。每個關鍵詞語可以是單字、詞組、短句或者任何的中文發(fā)音的組合?；贚D3320的語音識別系統(tǒng)可以隨著使用流程，在運行時動態(tài)地更改關鍵詞語列表的內(nèi)容，這樣可以用一個系統(tǒng)支持多種不同的場景，同時也不需要用戶作任何的錄音訓練。

3.2 LD3320的用戶使用模式

LD3320有兩種用戶使用模式，即觸發(fā)識別模式和循環(huán)識別模式.用戶可以通過編程，設置兩種不同的用戶使用模式。

觸發(fā)識別模式：系統(tǒng)的主控MCU在接收到外界一個觸發(fā)后(比如用戶按動某個按鍵)，啟動LD3320芯片的一個定時識別過程(比如5 s)，要求用戶在這個定時過程中說出要識別的語音關鍵詞語。這個過程結(jié)束后，需要用戶再次觸發(fā)才能再次啟動一個識別過程。

循環(huán)識別模式：系統(tǒng)的主控MCU反復啟動識別過程。如果沒有人說話就沒有識別結(jié)果，則每次識別過程的定時到時后再啟動一個識別過程;如果有識別結(jié)果，則根據(jù)識別作相應處理后(比如播放某個聲音作為回答)再啟動一個識別過程。

4 語音識別系統(tǒng)軟硬件設計

4.1 硬件系統(tǒng)設計

由圖l可知，由LD3320組成的語音識別系統(tǒng)硬件有單片機(或嵌入式系統(tǒng))及LD33202.圖2和圖3分別是由單片機STC10L08XE構(gòu)成的主控芯片和由LD3320A構(gòu)成的語音識別主系統(tǒng)。

圖2 STC10L08XE構(gòu)成的主控芯片

圖3 LD3320A構(gòu)成的語音識別主系統(tǒng)

4.2 軟件系統(tǒng)設計

語音識別的操作順序是：先進行語音識別的初始化，然后寫入識別列表，系統(tǒng)即開始進行語音識別，并準備好中斷響應函數(shù)，打開中斷允許位。這里如果不用中斷方式，也可以通過查詢方式工作。在開始識別后，讀取寄存器B2H的值，如果為21H就表示有識別結(jié)果產(chǎn)生。

上一頁 1 2 下一頁

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關鍵詞： LD3320 語音識別 應用

評論

相關推薦

2002年嵌入式系統(tǒng)及其應用研討會暨多國產(chǎn)品展示會

jackwang | 2002-05-16

LM386典型應用電路

設計方案 LM386 典型應用電路 | 2009-07-06

微軟197億美元完成對Nuance的收購目標不止在于語音識別市場

微軟 Nuance 收購語音識別 | 2022-03-10

蘋果讓步：允許媒體類應用繞過應用商店進行第三方支付

手機與無線通信蘋果應用商店 | 2021-09-03

大聯(lián)大品佳集團推出基于MediaTek產(chǎn)品的亞馬遜智能物聯(lián)網(wǎng)語音識別方案

物聯(lián)網(wǎng)與傳感器大聯(lián)大品佳 MediaTek 亞馬遜語音識別 | 2022-09-08

基于LD3320的助老助殘智能語音機器人

視頻信息技術大賽單片機 LD3320 語音機器人 | 2012-12-26

瞬態(tài)電壓抑制二極管應用指南

資源下載 TVS器件瞬態(tài)電壓抑制二極管應用 | 2007-02-16

在農(nóng)業(yè)經(jīng)濟結(jié)構(gòu)調(diào)整中應用信息技術的實踐與認識

hpnet | 2002-05-25

人工智能在動畫角色行為設計中的應用

智能計算 202307 人工智能動畫角色行為設計應用 | 2023-07-29

JavaScript語音識別庫-Julius

視頻 JavaScript 語音識別 Julius | 2015-07-07

基于Infineon SoC藍牙CYW20835之智能遙控器方案

物聯(lián)網(wǎng)與傳感器英飛凌藍牙 BT 遙控器紅外信號傳感器語音識別 2.4g 語音遙控 cyw20835 | 2023-08-02

美光高性能內(nèi)存與存儲，推動 AI 豐富殘障人士生活體驗

網(wǎng)絡與存儲語音識別生成式AI 機器學習內(nèi)存 | 2023-12-07

實時數(shù)據(jù)庫系統(tǒng)及其特征(老站轉(zhuǎn))

amine | 2002-05-27

AVR中文電子書-第七章AVR單片機的應用

資源下載 ATMEL 公司 AVR 單片機應用 | 2007-02-16

集成運放F007基本應用電路

設計方案集成運放基本應用電路 | 2009-07-06

人工智能技術在嵌入式開發(fā)中的應用

嵌入式系統(tǒng) 202307 人工智能技術嵌入式應用 | 2023-07-31

4 調(diào)用 Google 語音識別

視頻 Android Wear 圖靈機器人 Google 語音識別 | 2015-07-07

光電隔離器應用實例

設計方案光電隔離應用實例 | 2009-07-06

新一代語音識別：可徹底改變車內(nèi)體驗的技術

汽車電子語音識別生物識別人工智能 | 2024-07-18

LoRa專著問世，促進LoRa遍地開花

手機與無線通信 LoRa 應用 | 2021-08-09

步進電機小知識

資源下載步進電機電機驅(qū)動應用 | 2007-12-16

μC/OS的應用和擴展

amine | 2002-05-23

TA7240AP應用電路

設計方案 TA7240AP 應用電路 | 2009-07-06

語音模組重啟及聲音輸出異常淺析

消費電子 202106 智能家居語音識別可靠性 | 2021-07-12

LM324四運放的應用

資源下載四運放集成電路 LM324 應用 | 2007-02-16

MCS-51單片機主要應用特性

資源下載單片機 MCS-51 應用 | 2007-02-16

DSP虛擬I2C總線軟件包的設計及應用實例

hpnet | 2002-05-17

智能語音翻譯機

視頻信息技術大賽單片機 STC15F2K61S2 語音芯片 LD3320 | 2013-01-14

達林頓管的典型應用電路

設計方案達林頓典型應用電路 | 2009-07-06

焦點

推薦視頻

技術專區(qū)

關閉

<dfn id="zn1ub"><var id="zn1ub"></var></dfn>