深度:語(yǔ)音技術(shù)革命正在改變?nèi)祟惖慕涣鞣绞?/h1>
編者按:無(wú)論是在醫(yī)療、旅游、還是商業(yè)活動(dòng),以人工智能為代表的新技術(shù)正在徹底改變?nèi)伺c人之間的交流方式,并將打破身體、地域、國(guó)別、語(yǔ)種的各種限制。未來(lái),我們的交流對(duì)象也將不再局限在人類,可以是機(jī)器、可以是動(dòng)物。
MyTalkTools Mobile是由一位父親開(kāi)發(fā)的,以幫助他兒子克服通信困難,他的兒子出生時(shí)患有Nager綜合癥,這是一種影響聽(tīng)力、言語(yǔ)和其他能力的罕見(jiàn)疾病。目前該軟件已擁有超過(guò)10萬(wàn)名用戶。
本文引用地址:http://cafeforensic.com/article/201811/394166.htm 2017年初,微軟推出了GazeSpeak應(yīng)用程序,幫助肌萎縮性側(cè)索硬化(ALS)患者用眼球運(yùn)動(dòng)進(jìn)行溝通。該應(yīng)用通過(guò)手機(jī)攝像頭跟蹤患者的眼睛運(yùn)動(dòng),并用AI進(jìn)行字詞預(yù)測(cè)。
2)語(yǔ)音生成設(shè)備
機(jī)器學(xué)習(xí)、自然語(yǔ)言處理和文本預(yù)測(cè)技術(shù)極大地推動(dòng)輔助通信技術(shù)的發(fā)展,語(yǔ)音合成應(yīng)用可以為用戶提供定制化、個(gè)性化的服務(wù)。
語(yǔ)音生成設(shè)備可以將單詞或圖片轉(zhuǎn)化成語(yǔ)音,比輔助應(yīng)用APP更加先進(jìn)。某些產(chǎn)品允許用戶可以從幾種不同的聲音中進(jìn)行選擇,例如男性或女性,兒童或成人,甚至可以選擇一些地域口音。某些算法模型可以追蹤患者眼睛運(yùn)動(dòng)或頭部運(yùn)動(dòng)來(lái)進(jìn)行詞匯選擇,并合成語(yǔ)音。
Pocket Go Talk是一款可穿戴的小型便攜式AAC設(shè)備,也可以在桌面使用,具有五種可調(diào)節(jié)的掃描速度。通過(guò)5個(gè)易操作的按鈕生成25條語(yǔ)音消息,每條語(yǔ)音可以長(zhǎng)達(dá)12秒。
便攜式輔助書(shū)寫(xiě)平板MegaBee是在英國(guó)斯托克曼德維爾醫(yī)院的閉鎖綜合征患者的幫助下研發(fā)出來(lái)的。通過(guò)眼球運(yùn)動(dòng)和閃爍作為選擇字母或短語(yǔ)的方法,然后在屏幕上顯示,從而幫助中風(fēng)、多發(fā)性硬化癥、運(yùn)動(dòng)神經(jīng)元疾病患者及其它語(yǔ)言障礙患者進(jìn)行交流。
還有很多新興科技公司正在利用機(jī)器人技術(shù)提升患者的社交能力。盧森堡機(jī)器人公司LuxAI推出適用于自閉癥兒童的社交機(jī)器人QTrobot,實(shí)驗(yàn)證明,該機(jī)器人可以明顯增加自閉癥兒童的注意力和參與度,同時(shí)減少他們的焦慮和破壞行為。
美國(guó)波士頓公司VocalID利用眾包和語(yǔ)音混合技術(shù)為語(yǔ)言障礙患者提供個(gè)性化的合成語(yǔ)音。目前已有110多個(gè)國(guó)家的超過(guò)14000人為公司的語(yǔ)音庫(kù)The Human Voicebank提供了600多萬(wàn)句話。
2017年,谷歌宣布神經(jīng)網(wǎng)絡(luò)模型WaveNet正式商用于Google Assistant中,比初始模型效率提高了1000倍,可以更好地模擬自然語(yǔ)音。該模型可以根據(jù)真實(shí)的人類語(yǔ)音對(duì)音頻波形進(jìn)行建模分析,從中學(xué)習(xí)并創(chuàng)建自己的聲音。
3)代表未來(lái)的腦機(jī)接口
意念交流是很多科幻小說(shuō)和電影里的場(chǎng)景,而現(xiàn)在科研人員正在通過(guò)腦機(jī)接口技術(shù)將之變成現(xiàn)實(shí)。
早在1998年,英國(guó)雷丁大學(xué)的研究員Kevin Warwick博士在自己的手臂上植入一個(gè)發(fā)射器來(lái)控制門(mén)和其它裝置。2002年,他將電極接入自己的神經(jīng)系統(tǒng),以便用思維控制輪椅,并允許遠(yuǎn)程機(jī)器人手臂模仿他的手臂動(dòng)作。
Warwick博士的目標(biāo)是幫助語(yǔ)言障礙患者進(jìn)行溝通,他將一個(gè)芯片植入他妻子的手臂,通過(guò)互聯(lián)網(wǎng)將兩人的大腦聯(lián)系在一起,創(chuàng)造了世界上第一個(gè)腦—腦電子通信。
2012年,美國(guó)因中風(fēng)而癱瘓的患者Cathy Hutchinson利用腦植入芯片成功的用思維控制機(jī)器手臂端起一杯咖啡,并和吸管中喝了一口。
2014年初,法國(guó)公司Axilum Robotics與西班牙巴塞羅那大學(xué)、Starlab公司和哈佛醫(yī)學(xué)院一起進(jìn)行第一次腦對(duì)腦的溝通,在5000公里外,實(shí)現(xiàn)了直接在兩個(gè)人的大腦之間進(jìn)行溝通。
2016年埃隆·馬斯克成立了Neuralink公司進(jìn)行腦機(jī)接口研究,以幫助治療人類的腦部疾病。
2018年5月,俄羅斯新西伯利亞國(guó)立技術(shù)大學(xué)聲稱研制出了一款用意念控制的越野輪椅。頸部以下癱瘓者可乘坐該輪椅在室內(nèi)甚至城市街道上獨(dú)立行動(dòng)。
2018年6月,美國(guó)麻省理工學(xué)院下屬計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)的研究人員開(kāi)發(fā)了一種新界面系統(tǒng),它可以讀取人類操作人員的腦電波,通過(guò)思維命令機(jī)器執(zhí)行任務(wù)。
目前腦控科技已經(jīng)成為各國(guó)科研人員競(jìng)相研究的前沿課題。盡管大多數(shù)研究目前還停留在實(shí)驗(yàn)室階段,一旦該技術(shù)成功商業(yè)化,癱瘓者、語(yǔ)言障礙者、盲人等群體將迎來(lái)生命中的第二個(gè)春天。
語(yǔ)音2.0:語(yǔ)音界面技術(shù)和實(shí)時(shí)翻譯
未來(lái),科技創(chuàng)新將使人類的交流與溝通提升到另外一個(gè)層次,它不僅僅是幫助語(yǔ)言障礙患者進(jìn)行無(wú)障礙交流;還會(huì)在人與人或人與機(jī)器之間進(jìn)行信息交換。
由于人類語(yǔ)言的多樣化,限制了人與人之間的溝通,特別是跨國(guó)別和跨語(yǔ)種的交流。近幾年,隨著實(shí)時(shí)翻譯技術(shù)的成熟,語(yǔ)言鴻溝正被慢慢地消除。
2017年10月,谷歌推出Pixel Buds藍(lán)牙耳機(jī),使用Pixel智能手機(jī)即可在40種不同語(yǔ)言之間進(jìn)行即時(shí)翻譯。
微軟的Skype Translator可以對(duì)語(yǔ)音、視頻及50種語(yǔ)言的文本內(nèi)容實(shí)現(xiàn)八種語(yǔ)言之間的實(shí)時(shí)翻譯
各種便攜式翻譯設(shè)備可以幫助游客在幾秒鐘內(nèi)進(jìn)行語(yǔ)言翻譯。未來(lái),小小的耳機(jī)設(shè)備將打破出行的語(yǔ)言限制,而傳統(tǒng)的翻譯這一職業(yè)也將被新技術(shù)所替代。
在語(yǔ)言的新技術(shù)革命中,手語(yǔ)也正在被技術(shù)所替代。2015年,美國(guó)德克薩斯A&M大學(xué)開(kāi)發(fā)了一款可穿戴設(shè)備,通過(guò)感知用戶的手臂動(dòng)作,將手語(yǔ)翻譯成英語(yǔ)。該設(shè)備可以識(shí)別出大約40個(gè)美國(guó)標(biāo)準(zhǔn)手語(yǔ)動(dòng)作,準(zhǔn)確率達(dá)到了96%。
利益于人工智能技術(shù)的飛速發(fā)展,機(jī)器不僅僅是充當(dāng)翻譯人員,還可以成為溝通伙伴。據(jù)Gartner預(yù)測(cè),到今年年底,我們與新技術(shù)的互動(dòng)中有30%將通過(guò)與智能機(jī)器完成。目前每六個(gè)美國(guó)成年人中,就有一個(gè)擁有智能音箱或相關(guān)設(shè)備。除了控制智能家居外,亞馬遜的AI助手Alexa已經(jīng)可以幫助用戶在線購(gòu)物。未來(lái)AI助手將能實(shí)現(xiàn)更多的功能。
無(wú)論是在醫(yī)療、旅游、還是商業(yè)活動(dòng),以人工智能為代表的新技術(shù)正在徹底改變?nèi)伺c人之間的交流方式,并將打破身體、地域、國(guó)別、語(yǔ)種的各種限制。未來(lái),我們的交流對(duì)象也將不再局限在人類,可以是機(jī)器、可以是動(dòng)物。
這一切都是科技帶來(lái)的福利。科技,本該如此。
MyTalkTools Mobile是由一位父親開(kāi)發(fā)的,以幫助他兒子克服通信困難,他的兒子出生時(shí)患有Nager綜合癥,這是一種影響聽(tīng)力、言語(yǔ)和其他能力的罕見(jiàn)疾病。目前該軟件已擁有超過(guò)10萬(wàn)名用戶。
本文引用地址:http://cafeforensic.com/article/201811/394166.htm2017年初,微軟推出了GazeSpeak應(yīng)用程序,幫助肌萎縮性側(cè)索硬化(ALS)患者用眼球運(yùn)動(dòng)進(jìn)行溝通。該應(yīng)用通過(guò)手機(jī)攝像頭跟蹤患者的眼睛運(yùn)動(dòng),并用AI進(jìn)行字詞預(yù)測(cè)。
2)語(yǔ)音生成設(shè)備
機(jī)器學(xué)習(xí)、自然語(yǔ)言處理和文本預(yù)測(cè)技術(shù)極大地推動(dòng)輔助通信技術(shù)的發(fā)展,語(yǔ)音合成應(yīng)用可以為用戶提供定制化、個(gè)性化的服務(wù)。
語(yǔ)音生成設(shè)備可以將單詞或圖片轉(zhuǎn)化成語(yǔ)音,比輔助應(yīng)用APP更加先進(jìn)。某些產(chǎn)品允許用戶可以從幾種不同的聲音中進(jìn)行選擇,例如男性或女性,兒童或成人,甚至可以選擇一些地域口音。某些算法模型可以追蹤患者眼睛運(yùn)動(dòng)或頭部運(yùn)動(dòng)來(lái)進(jìn)行詞匯選擇,并合成語(yǔ)音。
Pocket Go Talk是一款可穿戴的小型便攜式AAC設(shè)備,也可以在桌面使用,具有五種可調(diào)節(jié)的掃描速度。通過(guò)5個(gè)易操作的按鈕生成25條語(yǔ)音消息,每條語(yǔ)音可以長(zhǎng)達(dá)12秒。
便攜式輔助書(shū)寫(xiě)平板MegaBee是在英國(guó)斯托克曼德維爾醫(yī)院的閉鎖綜合征患者的幫助下研發(fā)出來(lái)的。通過(guò)眼球運(yùn)動(dòng)和閃爍作為選擇字母或短語(yǔ)的方法,然后在屏幕上顯示,從而幫助中風(fēng)、多發(fā)性硬化癥、運(yùn)動(dòng)神經(jīng)元疾病患者及其它語(yǔ)言障礙患者進(jìn)行交流。
還有很多新興科技公司正在利用機(jī)器人技術(shù)提升患者的社交能力。盧森堡機(jī)器人公司LuxAI推出適用于自閉癥兒童的社交機(jī)器人QTrobot,實(shí)驗(yàn)證明,該機(jī)器人可以明顯增加自閉癥兒童的注意力和參與度,同時(shí)減少他們的焦慮和破壞行為。
美國(guó)波士頓公司VocalID利用眾包和語(yǔ)音混合技術(shù)為語(yǔ)言障礙患者提供個(gè)性化的合成語(yǔ)音。目前已有110多個(gè)國(guó)家的超過(guò)14000人為公司的語(yǔ)音庫(kù)The Human Voicebank提供了600多萬(wàn)句話。
2017年,谷歌宣布神經(jīng)網(wǎng)絡(luò)模型WaveNet正式商用于Google Assistant中,比初始模型效率提高了1000倍,可以更好地模擬自然語(yǔ)音。該模型可以根據(jù)真實(shí)的人類語(yǔ)音對(duì)音頻波形進(jìn)行建模分析,從中學(xué)習(xí)并創(chuàng)建自己的聲音。
3)代表未來(lái)的腦機(jī)接口
意念交流是很多科幻小說(shuō)和電影里的場(chǎng)景,而現(xiàn)在科研人員正在通過(guò)腦機(jī)接口技術(shù)將之變成現(xiàn)實(shí)。
早在1998年,英國(guó)雷丁大學(xué)的研究員Kevin Warwick博士在自己的手臂上植入一個(gè)發(fā)射器來(lái)控制門(mén)和其它裝置。2002年,他將電極接入自己的神經(jīng)系統(tǒng),以便用思維控制輪椅,并允許遠(yuǎn)程機(jī)器人手臂模仿他的手臂動(dòng)作。
Warwick博士的目標(biāo)是幫助語(yǔ)言障礙患者進(jìn)行溝通,他將一個(gè)芯片植入他妻子的手臂,通過(guò)互聯(lián)網(wǎng)將兩人的大腦聯(lián)系在一起,創(chuàng)造了世界上第一個(gè)腦—腦電子通信。
2012年,美國(guó)因中風(fēng)而癱瘓的患者Cathy Hutchinson利用腦植入芯片成功的用思維控制機(jī)器手臂端起一杯咖啡,并和吸管中喝了一口。
2014年初,法國(guó)公司Axilum Robotics與西班牙巴塞羅那大學(xué)、Starlab公司和哈佛醫(yī)學(xué)院一起進(jìn)行第一次腦對(duì)腦的溝通,在5000公里外,實(shí)現(xiàn)了直接在兩個(gè)人的大腦之間進(jìn)行溝通。
2016年埃隆·馬斯克成立了Neuralink公司進(jìn)行腦機(jī)接口研究,以幫助治療人類的腦部疾病。
2018年5月,俄羅斯新西伯利亞國(guó)立技術(shù)大學(xué)聲稱研制出了一款用意念控制的越野輪椅。頸部以下癱瘓者可乘坐該輪椅在室內(nèi)甚至城市街道上獨(dú)立行動(dòng)。
2018年6月,美國(guó)麻省理工學(xué)院下屬計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)的研究人員開(kāi)發(fā)了一種新界面系統(tǒng),它可以讀取人類操作人員的腦電波,通過(guò)思維命令機(jī)器執(zhí)行任務(wù)。
目前腦控科技已經(jīng)成為各國(guó)科研人員競(jìng)相研究的前沿課題。盡管大多數(shù)研究目前還停留在實(shí)驗(yàn)室階段,一旦該技術(shù)成功商業(yè)化,癱瘓者、語(yǔ)言障礙者、盲人等群體將迎來(lái)生命中的第二個(gè)春天。
語(yǔ)音2.0:語(yǔ)音界面技術(shù)和實(shí)時(shí)翻譯
未來(lái),科技創(chuàng)新將使人類的交流與溝通提升到另外一個(gè)層次,它不僅僅是幫助語(yǔ)言障礙患者進(jìn)行無(wú)障礙交流;還會(huì)在人與人或人與機(jī)器之間進(jìn)行信息交換。
由于人類語(yǔ)言的多樣化,限制了人與人之間的溝通,特別是跨國(guó)別和跨語(yǔ)種的交流。近幾年,隨著實(shí)時(shí)翻譯技術(shù)的成熟,語(yǔ)言鴻溝正被慢慢地消除。
2017年10月,谷歌推出Pixel Buds藍(lán)牙耳機(jī),使用Pixel智能手機(jī)即可在40種不同語(yǔ)言之間進(jìn)行即時(shí)翻譯。
微軟的Skype Translator可以對(duì)語(yǔ)音、視頻及50種語(yǔ)言的文本內(nèi)容實(shí)現(xiàn)八種語(yǔ)言之間的實(shí)時(shí)翻譯
各種便攜式翻譯設(shè)備可以幫助游客在幾秒鐘內(nèi)進(jìn)行語(yǔ)言翻譯。未來(lái),小小的耳機(jī)設(shè)備將打破出行的語(yǔ)言限制,而傳統(tǒng)的翻譯這一職業(yè)也將被新技術(shù)所替代。
在語(yǔ)言的新技術(shù)革命中,手語(yǔ)也正在被技術(shù)所替代。2015年,美國(guó)德克薩斯A&M大學(xué)開(kāi)發(fā)了一款可穿戴設(shè)備,通過(guò)感知用戶的手臂動(dòng)作,將手語(yǔ)翻譯成英語(yǔ)。該設(shè)備可以識(shí)別出大約40個(gè)美國(guó)標(biāo)準(zhǔn)手語(yǔ)動(dòng)作,準(zhǔn)確率達(dá)到了96%。
利益于人工智能技術(shù)的飛速發(fā)展,機(jī)器不僅僅是充當(dāng)翻譯人員,還可以成為溝通伙伴。據(jù)Gartner預(yù)測(cè),到今年年底,我們與新技術(shù)的互動(dòng)中有30%將通過(guò)與智能機(jī)器完成。目前每六個(gè)美國(guó)成年人中,就有一個(gè)擁有智能音箱或相關(guān)設(shè)備。除了控制智能家居外,亞馬遜的AI助手Alexa已經(jīng)可以幫助用戶在線購(gòu)物。未來(lái)AI助手將能實(shí)現(xiàn)更多的功能。
無(wú)論是在醫(yī)療、旅游、還是商業(yè)活動(dòng),以人工智能為代表的新技術(shù)正在徹底改變?nèi)伺c人之間的交流方式,并將打破身體、地域、國(guó)別、語(yǔ)種的各種限制。未來(lái),我們的交流對(duì)象也將不再局限在人類,可以是機(jī)器、可以是動(dòng)物。
這一切都是科技帶來(lái)的福利。科技,本該如此。
評(píng)論