色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

<ul id="i222u"></ul>

<option id="i222u"></option>

<pre id="i222u"></pre>

<sup id="i222u"></sup>

<kbd id="i222u"><del id="i222u"></del></kbd>

<bdo id="i222u"></bdo>

<kbd id="i222u"><tbody id="i222u"></tbody></kbd><pre id="i222u"><pre id="i222u"></pre></pre>

新聞中心

EEPW首頁 > 設(shè)計(jì)應(yīng)用 > 人工智能電視遠(yuǎn)場(chǎng)語音設(shè)計(jì)

人工智能電視遠(yuǎn)場(chǎng)語音設(shè)計(jì)

作者：郭斌林敏強(qiáng) 劉澤民時(shí)間：2018-09-27 來源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

收藏

編者按：本文介紹一種服務(wù)于人工智能電視，實(shí)現(xiàn)遠(yuǎn)場(chǎng)語音應(yīng)用的麥克風(fēng)陣列設(shè)計(jì)方案，闡述系統(tǒng)框架和硬件設(shè)計(jì)，同時(shí)介紹軟件設(shè)計(jì)的部分要點(diǎn)。通過麥克風(fēng)陣列，協(xié)助語音增強(qiáng)算法的實(shí)現(xiàn)，達(dá)到遠(yuǎn)距離拾音、回聲消除、聲源定位，滿足當(dāng)前智能語音應(yīng)用的需求。

作者 / 郭斌林敏強(qiáng) 劉澤民康佳集團(tuán)(廣東深圳 518053)

本文引用地址：http://cafeforensic.com/article/201809/392393.htm

　　郭斌(1980— )，男，康佳集團(tuán)多媒體研發(fā)中心新技術(shù)所所長(zhǎng)，主研電視前沿技術(shù)，無線通信方向。

　　林敏強(qiáng)(1990— )，男，康佳集團(tuán)多媒體研發(fā)中心硬件工程師，主研智能前沿技術(shù)，人機(jī)交互方向。

　　劉澤民(1994— )，男，康佳集團(tuán)多媒體研發(fā)中心硬件工程師，主研無線智能產(chǎn)品方向。

摘要：本文介紹一種服務(wù)于人工智能電視，實(shí)現(xiàn)遠(yuǎn)場(chǎng)語音應(yīng)用的麥克風(fēng)陣列設(shè)計(jì)方案，闡述系統(tǒng)框架和硬件設(shè)計(jì)，同時(shí)介紹軟件設(shè)計(jì)的部分要點(diǎn)。通過麥克風(fēng)陣列，協(xié)助語音增強(qiáng)算法的實(shí)現(xiàn)，達(dá)到遠(yuǎn)距離拾音、回聲消除、聲源定位，滿足當(dāng)前智能語音應(yīng)用的需求。

0 引言

　　人工智能是20世紀(jì)新興的一門學(xué)科，從發(fā)展之初就受到業(yè)界的廣泛關(guān)注。人工智能從廣義上定義是指具備語音感知、圖像感知以及其他信息感知，具備邏輯運(yùn)算能力，以仿人類的思維方式工作的智能系統(tǒng)。目前已經(jīng)取得了不俗的成果，人工智能產(chǎn)品也覆蓋到了人們生活的方方面面。人工智能科學(xué)具有廣闊的發(fā)展前景和巨大的發(fā)展?jié)摿?正確引導(dǎo)和規(guī)范人工智能科學(xué)的技術(shù)性發(fā)展和應(yīng)用,必將會(huì)給人類帶來巨大的財(cái)富^[1]。

　　隨著大數(shù)據(jù)、云計(jì)算、深度學(xué)習(xí)技術(shù)的不斷普及，語音技術(shù)的不斷優(yōu)化，人工智能越來越具備從"感知"到"認(rèn)知"的能力，產(chǎn)品形態(tài)的智能化程度越來越高^[2]。人工智能技術(shù)在電視上的應(yīng)用，將內(nèi)容和交互結(jié)合，聽歌、看劇、查詢...用戶都只需要開口就行，結(jié)合大數(shù)據(jù)后臺(tái)，便會(huì)根據(jù)用戶的喜好推送個(gè)性化歌曲推薦;接入智能家居系統(tǒng)，即可語音操控各種設(shè)備，十分便捷。

　　本文圍繞人工智能電視的遠(yuǎn)場(chǎng)語音設(shè)計(jì)展開，介紹功能實(shí)現(xiàn)的框架和原理。

1 硬件設(shè)計(jì)

　　基礎(chǔ)功能硬件實(shí)現(xiàn)架構(gòu)如圖1，采用4麥克風(fēng)條形線性陣列，模擬麥克風(fēng)經(jīng)ADC傳輸音頻信號(hào)給MCU處理。MCU采用ST的STM32F401CDU6作為主控方案，STM32F401CDU6是一顆32位 ARM核芯片，內(nèi)置512 KB Flash/96 KB RAM，低延遲，工作頻率高達(dá)84 MHz,支持寬電壓1.7 V~3.6 V。模塊方案通過ADC將A-MIC模擬信號(hào)轉(zhuǎn)成I2S傳輸給MCU，MCU通過USB2.0和TV SOC傳輸音頻數(shù)據(jù)。通過麥克風(fēng)陣列模塊搭配算法有效實(shí)現(xiàn)聲源定位、波束成形、去混響、降噪、增益調(diào)節(jié)、回聲消除等功能(下文結(jié)合軟件模塊展開闡述)。

人工智能-1.jpg

　　1.1 麥克風(fēng)選料

　　麥克風(fēng)選用靈敏度-25 dB，信噪比74 dB的A-MIC，同時(shí)采用接線外拉的形式，有效避免生產(chǎn)過程中因高溫焊接導(dǎo)致的麥克風(fēng)靈敏度下降或損壞等問題，保證陣列麥克風(fēng)靈敏度的一致性，對(duì)整體算法的精確度有比較好的控制和要求。不過相應(yīng)的會(huì)對(duì)整機(jī)生產(chǎn)裝配造成難度以及增加人工成本，設(shè)計(jì)之初需要做好防呆設(shè)計(jì)，提高安裝可靠性和效率。

　　1.2 供電設(shè)計(jì)

　　模塊采用獨(dú)立的供電，電視待機(jī)時(shí)，可支持通過模塊待機(jī)喚醒操作。模塊需要區(qū)分電視待機(jī)和開機(jī)狀態(tài)，開機(jī)狀態(tài)下，喚醒詞拉起語音應(yīng)用。待機(jī)狀態(tài)下，喚醒詞本地處理通過I/O口發(fā)起開機(jī)信號(hào)。因此待機(jī)時(shí)，供電關(guān)閉500 ms后重啟，模塊重新讀取USB數(shù)據(jù)信號(hào)是否為空，以此來判斷主機(jī)狀態(tài)。

　　1.3 參考信號(hào)設(shè)計(jì)

　　參考信號(hào)指的是主機(jī)端提供給模塊的音頻參考，作為回聲消除算法的依據(jù)。參考音頻由功放輸出信號(hào)，經(jīng)過分壓、濾波后傳輸給模塊。根據(jù)芯片取值范圍要求，確保輸入到模塊的參考信號(hào)幅值≤1 Vrms，即圖2中從AMP+/-經(jīng)分壓后到SPK+/-的信號(hào)≤1 Vrms。

人工智能-2.jpg

　　這里提到另外一種分壓方式，如圖3，由于R36、R38阻值存在誤差以及喇叭的寄生電容等影響，改變了差分信號(hào)走線的阻抗，使得其對(duì)于共模干擾抑制能力減弱，且容易在參考信號(hào)中引入雜音、破音。實(shí)際測(cè)試對(duì)比兩者播放1 kHz測(cè)試音頻時(shí)，該分壓方式產(chǎn)生明顯的失真，如圖4對(duì)比。

人工智能-3.jpg

2 軟件設(shè)計(jì)

　　軟件分本地處理和云端處理兩部分。如圖6，淺灰色部分為本地處理，深灰色部分為云端處理。本地算法包括回聲消除AEC、聲源定位DOA、波束形成BF、去混響DER、降噪NS、自動(dòng)增益調(diào)節(jié)AGC、頻域均衡EQ，最終編碼傳輸。云端主要負(fù)責(zé)對(duì)接收到的音頻進(jìn)行文本識(shí)別、自然語言處理NLP、最終經(jīng)過業(yè)務(wù)邏輯和技能處理，將結(jié)果經(jīng)TTS服務(wù)器反饋給用戶。其中，在識(shí)別處理的同時(shí)，音頻信號(hào)經(jīng)VPR服務(wù)器進(jìn)行讀取，對(duì)音頻分析特征值，也就是聲紋識(shí)別。聲紋識(shí)別的結(jié)果也提供給業(yè)務(wù)單元處理。

人工智能-4.jpg

　　2.1 回聲消除

　　自適應(yīng)回聲抵消的基本思想是估計(jì)回聲路徑的特征參數(shù)，產(chǎn)生一個(gè)模擬的回音路徑，得出模擬回聲信號(hào)，從接收信號(hào)中減去該信號(hào)，實(shí)現(xiàn)回聲抵消。圖5給出了單向傳輸?shù)穆晫W(xué)消回聲器AEC的原理圖。圖5中，x(n)代表麥克風(fēng)拾音的信號(hào)，包含了本地聲音和目標(biāo)人聲;y(n)是經(jīng)過回聲通道而產(chǎn)生的不期望的回聲;r(n)是經(jīng)算法抵消后的目標(biāo)人聲;A口的信號(hào)x(n)疊加有不期望的回聲^[3]。

人工智能-5.jpg

　　2.2 聲源定位及波束形成

　　麥克風(fēng)拾音在實(shí)際應(yīng)用環(huán)境中不僅僅有直接到達(dá)的目標(biāo)語音，還有目標(biāo)語音經(jīng)過墻面反射、衍射等其他路徑到達(dá)的部分及混響，以及環(huán)境噪音及本地噪音的干擾。聲源定位即依靠分布式麥克風(fēng)陣列，對(duì)接收到的信號(hào)進(jìn)行函數(shù)運(yùn)算，根據(jù)計(jì)算的信號(hào)時(shí)延差獲取目標(biāo)音源的角度方向。波束形成的原理利用麥克風(fēng)陣列的特性，將噪聲進(jìn)行抑制或進(jìn)行非常大的衰減以提高接受目標(biāo)信號(hào)的質(zhì)量^[4]。

　　2.3 語音識(shí)別

　　語音識(shí)別的過程主要由遠(yuǎn)場(chǎng)或近場(chǎng)方式進(jìn)行拾音，由語音識(shí)別服務(wù)器(ASR)和語義理解服務(wù)器(NLP)完成錄音文件識(shí)別和結(jié)果轉(zhuǎn)換。識(shí)別結(jié)果經(jīng)語音合成服務(wù)器(TTS)合成人聲將結(jié)果反饋給用戶。

人工智能-6.jpg

　　語音識(shí)別服務(wù)器(ASR)主要將電視端錄入的音頻文件進(jìn)行識(shí)別，將識(shí)別結(jié)果的文本直接發(fā)送給語義理解服務(wù)器進(jìn)行解析，可以分為遠(yuǎn)場(chǎng)/近場(chǎng)以及不同方言進(jìn)行處理。

　　語義理解服務(wù)器(NLP)，目前使用主服務(wù)器加輔助服務(wù)器的模式進(jìn)行語義理解處理，在語音識(shí)別服務(wù)將文字傳給語義理解服務(wù)器后，使用第三方提供的主服務(wù)器進(jìn)行優(yōu)先解析，識(shí)別結(jié)果進(jìn)行權(quán)重值計(jì)算，權(quán)重值高的識(shí)別結(jié)果直接返回客戶端進(jìn)行處理;權(quán)重值低的識(shí)別結(jié)果返回給康佳語義理解服務(wù)器，由康佳語義理解服務(wù)器進(jìn)行二次處理和轉(zhuǎn)發(fā)，如果主服務(wù)器不能識(shí)別的語句則由康佳語義理解服務(wù)器進(jìn)行識(shí)別，然后根據(jù)識(shí)別結(jié)果的領(lǐng)域分發(fā)給其他對(duì)應(yīng)在該領(lǐng)域處理比較好的其它服務(wù)器進(jìn)行語義理解處理，識(shí)別之后返回康佳服務(wù)器再統(tǒng)一返回客戶端進(jìn)行處理。

人工智能-7.jpg

　　語音合成服務(wù)器，主要將識(shí)別結(jié)果和理解處理結(jié)果的文本進(jìn)行語音合成和人聲播報(bào)，可以定義不同的人聲播報(bào)達(dá)到不同的效果，處理結(jié)果為生成一個(gè)音頻文件返回給客戶端。

3 小結(jié)

　　隨著人工智能技術(shù)的發(fā)展，語音成為了不可或缺的主要交互手段。麥克風(fēng)陣列在智能音箱、智能電視甚至智能空調(diào)、冰箱、抽油煙機(jī)等家電上都逐漸開始應(yīng)用，市場(chǎng)一度出現(xiàn)了人工智能熱。麥克風(fēng)陣列的設(shè)計(jì)及應(yīng)用是AI智能服務(wù)落地的基礎(chǔ)，本文提出人工智能電視遠(yuǎn)場(chǎng)語音麥克風(fēng)陣列的設(shè)計(jì)，從硬件系統(tǒng)、軟件模塊、性能原理、以及器件選型等多方面進(jìn)行了原理分析研究和設(shè)計(jì)方案闡述，配合云端后臺(tái)，實(shí)現(xiàn)電視人工智能對(duì)話的場(chǎng)景。

　　參考文獻(xiàn)：

　　[1]王太忠,呂葉. 人工智能淺析[J]. 科教文匯(上旬刊). 2012(09):70-71

　　[2]陳長(zhǎng)偉. 人工智能+內(nèi)容開啟廣電智媒體時(shí)代[J]. 有線電視技術(shù). 2017(11)：26-29

　　[3]王慶輝,李永哲. VoIP聲學(xué)回聲消除算法研究[J] , 現(xiàn)代電子技術(shù), 2009 (07).

　　[4]杜軍,桑勝舉. 基于麥克風(fēng)陣列的語音增強(qiáng)技術(shù)及應(yīng)用[J]. 計(jì)算機(jī)應(yīng)用與軟件. 2009(10)

　　本文來源于《電子產(chǎn)品世界》2018年第10期第50頁，歡迎您寫論文時(shí)引用，并注明出處。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 人工智能 語音識(shí)別 麥克風(fēng)陣列 語音增強(qiáng) 遠(yuǎn)距離拾音 201810

評(píng)論

相關(guān)推薦

人工智能歷史

Lamborghini | 2011-03-15

AMD斥資6.65億美元收購(gòu)芬蘭AI公司 Silo AI

智能計(jì)算 AMD silo AI 人工智能 | 2024-07-15

語音識(shí)別在遙控系統(tǒng)中的應(yīng)用設(shè)計(jì)

資源下載語音識(shí)別 DTW FED FRED 學(xué)習(xí)型遙控器 | 2007-04-19

有簡(jiǎn)單人工智能的溫度控制電路

設(shè)計(jì)方案簡(jiǎn)單人工智能溫度控制 | 2009-09-01

基于DTW模型的語音識(shí)別

資源下載 DTW模型語音識(shí)別 MATLAB | 2007-04-19

機(jī)器里的大腦：一位“隱士”開發(fā)者的人工智能夢(mèng)（下篇）

隨風(fēng)搖擺 | 2015-11-16

仿人機(jī)器人

資源下載仿人機(jī)器人傳感器人工智能 | 2007-04-19

JavaScript語音識(shí)別庫-Julius

視頻 JavaScript 語音識(shí)別 Julius | 2015-07-07

推動(dòng)電動(dòng)汽車發(fā)展：利用機(jī)器視覺和人工智能提升鋰離子電池質(zhì)量

智能計(jì)算電動(dòng)汽車機(jī)器視覺檢測(cè) 人工智能 | 2024-07-18

借助電源完整性測(cè)試提高人工智能數(shù)據(jù)中心的能效

測(cè)試測(cè)量電源完整性測(cè)試人工智能數(shù)據(jù)中心 | 2024-07-19

未來的人工智能世界：技術(shù)與人文的和諧還是斗爭(zhēng)？

藍(lán)盒子 | 2007-09-11

ADI公司：工業(yè)4.0——人工智能的端

視頻 ADI 人工智能工業(yè)4.0 | 2019-11-08

具有人工智能的溫度控制電路圖

設(shè)計(jì)方案具有人工智能溫度控制電路圖 | 2012-07-24

人工智能與機(jī)器人

視頻物聯(lián)網(wǎng) 可穿戴設(shè)備智能硬件高峰論壇機(jī)器人人工智能 | 2015-01-19

電視機(jī)智能聲控選合系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

資源下載語音識(shí)別彩電遙控智能聲控選臺(tái) | 2007-02-16

革新企業(yè)數(shù)據(jù)管理，邁向“真正的”混合云時(shí)代

人工智能 AI | 2024-07-03

本科畢業(yè)設(shè)計(jì)：一種基于發(fā)育思想的語音識(shí)別系統(tǒng)實(shí)現(xiàn)

資源下載語音識(shí)別人工智能自主式機(jī)器發(fā)育思想自組織映射網(wǎng)絡(luò) 簡(jiǎn)單反饋神經(jīng)網(wǎng)絡(luò) | 2007-04-19

傳蘋果智能將錯(cuò)過iOS 18 9月份大升級(jí) 推遲1個(gè)月發(fā)布

手機(jī)與無線通信蘋果智能 iOS 18 推遲人工智能 iPhone iPad Apple Intelligence | 2024-07-29

STC-人工智能二維生命探測(cè)儀

renazan2000 | 2013-01-14

微軟X英特爾黑客松大賽

視頻英特爾微軟黑客松人工智能 OpenVINO | 2021-07-27

有簡(jiǎn)單人工智能的溫度控制電路圖

設(shè)計(jì)方案簡(jiǎn)單人工智能溫度控制電路圖 | 2010-09-01

具有人工智能的溫度控制電路設(shè)計(jì)

設(shè)計(jì)方案具有人工智能溫度控制電路設(shè)計(jì) | 2012-07-24

機(jī)器里的大腦：一位“隱士”開發(fā)者的人工智能夢(mèng)（上篇）

隨風(fēng)搖擺 | 2015-11-09

ST Edge AI Suite人工智能開發(fā)套件正式上線快采用意法半導(dǎo)體技術(shù)的AI產(chǎn)品開發(fā)速度

智能計(jì)算 ST Edge AI Suite 人工智能意法半導(dǎo)體 AI | 2024-07-08

新一代語音識(shí)別：可徹底改變車內(nèi)體驗(yàn)的技術(shù)

汽車電子語音識(shí)別生物識(shí)別人工智能 | 2024-07-18

工信部人工智能標(biāo)準(zhǔn)化技術(shù)委員會(huì)籌建方案公示

智能計(jì)算工信部人工智能 | 2024-07-03

簡(jiǎn)單人工智能的溫度控制電路

設(shè)計(jì)方案簡(jiǎn)單人工智能溫度控制 | 2009-07-06

OpenAI陷入安全危機(jī)：攻擊者成功入侵內(nèi)部消息系統(tǒng)

OpenAI 人工智能 | 2024-07-08

馬斯克詢問網(wǎng)友：特斯拉向xAI投50億美元行不行

智能計(jì)算馬斯克特斯拉 xAI 人工智能 | 2024-07-25

4 調(diào)用 Google 語音識(shí)別

視頻 Android Wear 圖靈機(jī)器人 Google 語音識(shí)別 | 2015-07-07

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)