色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

<small id="ydvpx"><tbody id="ydvpx"></tbody></small>

新聞中心

EEPW首頁 > 消費電子 > 業(yè)界動態(tài) > 人工智能助力科大訊飛語音轉(zhuǎn)寫技術(shù)新突破

人工智能助力科大訊飛語音轉(zhuǎn)寫技術(shù)新突破

作者：時間：2016-02-05 來源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

　　近年來，隨著“人工智能”逐漸成為新時代科技發(fā)展的方向，整個語音行業(yè)也迅速成長。其中，尤以聽寫技術(shù)發(fā)展最為迅速，目前已廣泛在語音輸入、語音搜索、語音助手等產(chǎn)品中得到應(yīng)用并日臻成熟。

本文引用地址：http://cafeforensic.com/article/201602/286780.htm

　　但語音技術(shù)并不因此止步，聽寫技術(shù)解決的是人機對話問題，更多適用于朗讀式風(fēng)格說話這類很工整的語音，專為識別而生。而現(xiàn)實的場景卻復(fù)雜得多——會議、采訪、演講、交談等自然場景下的語音第一目的并非為了轉(zhuǎn)寫，因此不僅在質(zhì)量上有先天缺陷，而且是不注重發(fā)音、語速、環(huán)境等影響因素的隨意性非工整語音，對機器的敏感度是極大的挑戰(zhàn)。這就需要在音頻的轉(zhuǎn)寫技術(shù)方面有所突破，就主流技術(shù)趨勢而言，解決會話風(fēng)格和錄音質(zhì)量兩個問題就成為技術(shù)突破的核心要求。

　　國內(nèi)語音產(chǎn)業(yè)龍頭科大訊飛在語音領(lǐng)域深耕多年，而日前科大訊飛年度發(fā)布會上亮相的最新成果恰恰包括語音轉(zhuǎn)寫方面的技術(shù)突破，讓人喜出望外。

　　兩大技術(shù)雙劍合璧突圍人人對話

　　解決人人對話轉(zhuǎn)寫問題的難點在于其場景的復(fù)雜性與影響因素的多樣性，不僅需要海量的人人交談數(shù)據(jù)，更核心的是需要在海量數(shù)據(jù)基礎(chǔ)上進行建模。為突破這一技術(shù)難點，經(jīng)過潛心研究，訊飛獨家推出兩大技術(shù)——篇章級處理技術(shù)和口語風(fēng)格處理技術(shù)。

　　科大訊飛通過聲學(xué)模型建模技術(shù)和語言模型建模技術(shù)的創(chuàng)新提高了通用場景的識別率，在此基礎(chǔ)上利用篇章級處理技術(shù)(包括AM自適應(yīng)、LM自適應(yīng)、領(lǐng)域LM、語義LM等)，使雜亂無章的數(shù)據(jù)變得有跡可循。值得一提的是，在提高通用識別率方面，訊飛掌握了近一兩年才成功應(yīng)用于語音識別中的最新的雙向RNN技術(shù)和當(dāng)下比較火的CTC建模技術(shù)，使得識別率比DNN技術(shù)和雙向RNN技術(shù)分別相對提升了25%和10%。目前，說話人自適應(yīng)技術(shù)已申請專利。

　　針對人人對話場景中出現(xiàn)的口語詞、猶豫詞、重復(fù)等情況，通過口語風(fēng)格處理技術(shù)，讓機器自動學(xué)習(xí)重復(fù)、會跳弧，解決口語場景下的識別問題。

　　混響技術(shù)新突破成就高品質(zhì)識別

　　混響降噪一直是語音轉(zhuǎn)寫的一大難點。對于為了聽感而錄制的有損失的語音，訊飛綜合利用DNN加混響技術(shù)和DNN去混響技術(shù)，解決遠場錄音的混響問題。所謂加混響，即在近場的清晰數(shù)據(jù)基礎(chǔ)上加上混響，仿造混響數(shù)據(jù)，形成遠場語音，再對機器進行混合訓(xùn)練，使模型的魯棒性更好。降噪的方式類似。

　　而如何從源頭上解決混響和降噪似乎才是問題的關(guān)鍵，訊飛獨辟蹊徑，將技術(shù)創(chuàng)新與專為轉(zhuǎn)寫而設(shè)計的硬件設(shè)備結(jié)合來解決這一問題。在智能錄音設(shè)備上加上多麥克陣列，利用陣列解混響技術(shù)去混響。再與單麥克解混響技術(shù)結(jié)合，進一步提高遠場環(huán)境下的識別率。目前，運用單麥克解混響技術(shù)識別率可達到90%以上。

　　文本摘要技術(shù)嶄露頭角

　　解決了人人對話場景的轉(zhuǎn)寫問題，人工智能大潮下，語音技術(shù)的下一步必然是繼續(xù)在更智能的方向朝前邁進——文本摘要技術(shù)成為可預(yù)見的迫切需求。摘要本質(zhì)上是一種高層的語義理解，不僅國內(nèi)尚屬空白，國際范圍內(nèi)也鮮有成果。訊飛目前正在做的是先對文本進行預(yù)處理，包括異常檢測、標(biāo)點預(yù)測、內(nèi)容順滑等，過濾掉識別錯誤、重復(fù)詞、預(yù)期詞，再通過Encoder-Decoder框架解決自動摘要問題，現(xiàn)已獲得專利，有望在明年投入使用。

　　技術(shù)的進步終將落腳于功能和產(chǎn)品，從而服務(wù)人們的工作生活。目前，語音轉(zhuǎn)寫技術(shù)的最新發(fā)展成果已應(yīng)用于科大訊飛旗下的音頻轉(zhuǎn)文字服務(wù)平臺——訊飛聽見(www.iflyrec.com/)、手機APP錄音寶、訊飛聽見錄音筆等產(chǎn)品上，涵蓋了多種終端，成為人工智能發(fā)展的重要推力。同時，隨著移動互聯(lián)網(wǎng)、智能硬件浪潮的到來，科大訊飛整合了各技術(shù)領(lǐng)域多年的研究成果，構(gòu)建了全球首個智能人機交互平臺——“訊飛開放平臺”：將以語音交互為核心的人工智能技術(shù)開放給業(yè)界開發(fā)者。未來，通過科大訊飛的技術(shù)開放，將有更多類似“訊飛聽見”的人工智能落地化產(chǎn)品能夠快速實現(xiàn)。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 人工智能 科大訊飛

評論

相關(guān)推薦

機器里的大腦：一位“隱士”開發(fā)者的人工智能夢（上篇）

隨風(fēng)搖擺 | 2015-11-09

3 語音云開放平臺注冊賬號與創(chuàng)建應(yīng)用

視頻科大訊飛 Android 語音 | 2015-07-07

有簡單人工智能的溫度控制電路

設(shè)計方案簡單人工智能溫度控制 | 2009-09-01

4 語音SDK介紹

視頻科大訊飛 Android 語音 SDK | 2015-07-07

人工智能與機器人

視頻物聯(lián)網(wǎng) 可穿戴設(shè)備智能硬件高峰論壇機器人人工智能 | 2015-01-19

ST Edge AI Suite人工智能開發(fā)套件正式上線快采用意法半導(dǎo)體技術(shù)的AI產(chǎn)品開發(fā)速度

智能計算 ST Edge AI Suite 人工智能意法半導(dǎo)體 AI | 2024-07-08

簡單人工智能的溫度控制電路

設(shè)計方案簡單人工智能溫度控制 | 2009-07-06

推動電動汽車發(fā)展：利用機器視覺和人工智能提升鋰離子電池質(zhì)量

智能計算電動汽車機器視覺檢測人工智能 | 2024-07-18

機器里的大腦：一位“隱士”開發(fā)者的人工智能夢（下篇）

隨風(fēng)搖擺 | 2015-11-16

有簡單人工智能的溫度控制電路圖

設(shè)計方案簡單人工智能溫度控制電路圖 | 2010-09-01

1 科大訊飛語音服務(wù)概述

視頻科大訊飛 Android 語音 | 2015-07-07

2 語音云開放平臺介紹

視頻科大訊飛 Android 語音 | 2015-07-07

STC-人工智能二維生命探測儀

renazan2000 | 2013-01-14

馬斯克詢問網(wǎng)友：特斯拉向xAI投50億美元行不行

智能計算馬斯克特斯拉 xAI 人工智能 | 2024-07-25

借助電源完整性測試提高人工智能數(shù)據(jù)中心的能效

測試測量電源完整性測試人工智能數(shù)據(jù)中心 | 2024-07-19

具有人工智能的溫度控制電路圖

設(shè)計方案具有人工智能溫度控制電路圖 | 2012-07-24

AMD斥資6.65億美元收購芬蘭AI公司 Silo AI

智能計算 AMD silo AI 人工智能 | 2024-07-15

東南大學(xué)人工智能03

資源下載人工智能計算機科學(xué) 聲音識別 | 2007-04-20

人工智能歷史

Lamborghini | 2011-03-15

工信部人工智能標(biāo)準(zhǔn)化技術(shù)委員會籌建方案公示

智能計算工信部人工智能 | 2024-07-03

具有人工智能的溫度控制電路設(shè)計

設(shè)計方案具有人工智能溫度控制電路設(shè)計 | 2012-07-24

DigiKey推出《數(shù)字化城市》第4 季視頻系列，聚焦人工智能

智能計算 DigiKey 數(shù)字化城市人工智能 | 2024-06-28

東南大學(xué)人工智能01

資源下載人工智能語言識別圖像識別自然語言處理專家系統(tǒng) | 2007-04-20

未來的人工智能世界：技術(shù)與人文的和諧還是斗爭？

藍盒子 | 2007-09-11

OpenAI陷入安全危機：攻擊者成功入侵內(nèi)部消息系統(tǒng)

OpenAI 人工智能 | 2024-07-08

本科畢業(yè)設(shè)計：一種基于發(fā)育思想的語音識別系統(tǒng)實現(xiàn)

資源下載語音識別人工智能自主式機器發(fā)育思想自組織映射網(wǎng)絡(luò) 簡單反饋神經(jīng)網(wǎng)絡(luò) | 2007-04-19

仿人機器人

資源下載仿人機器人傳感器人工智能 | 2007-04-19

革新企業(yè)數(shù)據(jù)管理，邁向“真正的”混合云時代

人工智能 AI | 2024-07-03

東南大學(xué)人工智能02

資源下載人工智能大規(guī)模集成電路自適應(yīng)能力 | 2007-04-20

新一代語音識別：可徹底改變車內(nèi)體驗的技術(shù)

汽車電子語音識別生物識別人工智能 | 2024-07-18

焦點

推薦視頻

技術(shù)專區(qū)

<source id="ajjnh"></source>