聽(tīng)懂”人話(huà) 智能語(yǔ)音爭(zhēng)奪人工智能皇冠上的“明珠”
吼一吼就可登App?近日,云知聲聲紋登錄系統(tǒng),成功率可達(dá)99%。與智能語(yǔ)音先行者科大訊飛相似,兩家公司創(chuàng)始人師出同門(mén)。
本文引用地址:http://cafeforensic.com/article/201903/398189.htm除了專(zhuān)業(yè)的語(yǔ)音技術(shù)廠(chǎng)商,互聯(lián)網(wǎng)科技巨頭也紛紛涌入語(yǔ)音賽道中來(lái)。2月20日,在小米的新品發(fā)布上,小愛(ài)觸屏音箱亮相,而在這兩天前,騰訊也出面澄清,聽(tīng)聽(tīng)(音箱)一直在正常研發(fā)和銷(xiāo)售運(yùn)營(yíng),面向行業(yè)輸出全棧語(yǔ)音人工智能解決方案能力。
智能語(yǔ)音被譽(yù)為人工智能皇冠上的“明珠”,近段時(shí)間以來(lái)熱度不減,隨著深度學(xué)習(xí)技術(shù)的突破,大數(shù)據(jù)技術(shù)以及自然語(yǔ)言理解能力的提升,帶動(dòng)了一波產(chǎn)業(yè)熱潮,除了在教育、客服、電信等傳統(tǒng)行業(yè)之外,還開(kāi)辟出了車(chē)載、家居、醫(yī)療、智能硬件等語(yǔ)音技術(shù)應(yīng)用新天地。
“聽(tīng)懂”人話(huà),語(yǔ)音方案“百花齊放”
走進(jìn)廣州迅羽通信技術(shù)公司的客服中心,敲擊鍵盤(pán)的聲音不再此起彼伏,客服人員更多在傾聽(tīng)和安靜地回復(fù)來(lái)電。
迅羽先后承運(yùn)了香港快運(yùn)、電訊盈科、和記電訊、東亞銀行、亞航以及廣東省12348司法、廣東電力與國(guó)稅熱線(xiàn)等國(guó)內(nèi)外超大型客服服務(wù)。一直以來(lái),傳統(tǒng)的客服呼叫中心是勞動(dòng)密集型產(chǎn)業(yè),由于內(nèi)地人力成本優(yōu)勢(shì),香港一些電信業(yè)、銀行業(yè)、航空業(yè)等將呼叫中心外包,但隨著人力成本的提升,呼叫中心的利潤(rùn)進(jìn)一步被壓縮。
從去年9月起,迅羽聯(lián)合哈工大共同成立人工智能自動(dòng)問(wèn)答技術(shù)研發(fā)實(shí)驗(yàn)室,著手引入AI。經(jīng)測(cè)算,有七成動(dòng)作是可替代的——客服人員大部分時(shí)間都在文字錄入和反復(fù)確認(rèn),而如今,每當(dāng)客戶(hù)一報(bào)完身份證號(hào)碼、家庭地址等信息時(shí),就已經(jīng)自動(dòng)錄入系統(tǒng),而客服人員則可專(zhuān)注聽(tīng)取客戶(hù)的反饋。在臺(tái)風(fēng)等極端天氣下,面對(duì)激增的訂改機(jī)票業(yè)務(wù)也更從容,避免了人員配備過(guò)多。
機(jī)器能“聽(tīng)懂”人話(huà),已經(jīng)深入各種場(chǎng)景??拼笥嶏w與上海高院合作的刑事案件輔助辦案系統(tǒng)投用后,目前已開(kāi)始在全國(guó)范圍內(nèi)擴(kuò)展,輔助辦案系統(tǒng)有望在國(guó)內(nèi)法院系統(tǒng)全面鋪開(kāi),并向更多罪種、民商行政案件等方向延伸,截至今年初,審訊產(chǎn)品于法庭拓展迅速,已覆蓋815個(gè)法院、4200個(gè)法庭。
陪你聊,陪你跳,會(huì)管家,會(huì)傳情……深圳狗尾草智能科技公司不僅推出了呆萌又暖心的情感社交機(jī)器人,還打造出全球首個(gè)3D全息AI虛擬生命“琥珀”,在日趨白熱化的語(yǔ)音市場(chǎng)中走出了一條差異化道路。
“幫我調(diào)下明天上午7點(diǎn)的鬧鐘?!闭Z(yǔ)音識(shí)別距離大眾并不遙遠(yuǎn),在移動(dòng)終端上,用戶(hù)可以實(shí)現(xiàn)手機(jī)讀短信、介紹餐廳、詢(xún)問(wèn)天氣、語(yǔ)音設(shè)置鬧鐘等,智能音箱更被認(rèn)為是控制智能家居的自然入口,從“百箱大戰(zhàn)”到現(xiàn)在的語(yǔ)音方案“百花齊放”,互聯(lián)網(wǎng)平臺(tái)商、語(yǔ)音技術(shù)硬件服務(wù)商、內(nèi)容和云服務(wù)商、芯片商等,都相繼推出了各自支持設(shè)備智能化升級(jí)的方案。
不是替代人,而是更好發(fā)揮人的價(jià)值
通過(guò)人工智能語(yǔ)音交互,機(jī)器不僅能聽(tīng)懂人話(huà),還能更好地發(fā)掘人的價(jià)值。
通過(guò)匯聚學(xué)生的家庭作業(yè)、課堂訓(xùn)練數(shù)據(jù),科大訊飛用語(yǔ)音識(shí)別對(duì)內(nèi)容進(jìn)行語(yǔ)義理解分析,判斷作業(yè)對(duì)錯(cuò),提供改進(jìn)方案?!叭斯ぶ悄?大數(shù)據(jù)結(jié)合因材施教,比如同一個(gè)班學(xué)生對(duì)內(nèi)容接受度是不一樣的,每個(gè)人的知識(shí)點(diǎn)情況掌握又是怎樣的,單個(gè)學(xué)生上一個(gè)知識(shí)點(diǎn)有沒(méi)有掌握,都可以有針對(duì)性地改進(jìn)?!笨拼笥嶏w高級(jí)副總裁杜蘭說(shuō)。
杜蘭說(shuō),AI賦能教育產(chǎn)業(yè)不是要取代老師這個(gè)職業(yè),而是可替代批改等瑣碎事務(wù),解放老師更多時(shí)間。
迅羽副總經(jīng)理黃勉超也同樣認(rèn)為,AI的出現(xiàn),并不是要用機(jī)器人來(lái)取代人,而是與機(jī)器有更好分工,“有一半用戶(hù)是帶著情緒或投訴打進(jìn)電話(huà)來(lái),但如果他們面對(duì)的是一臺(tái)毫無(wú)表情的機(jī)器,只會(huì)繼續(xù)帶著憤怒掛掉電話(huà)”。
黃勉超還發(fā)現(xiàn),引入AI后,客服業(yè)務(wù)有了更多科技含量,品牌形象大為提升,公司在招人時(shí)也更有底氣,“以前這行業(yè)的人會(huì)覺(jué)得,大好青春就在這1平米的格子間日復(fù)一日從事簡(jiǎn)單枯燥的事情,他們會(huì)覺(jué)得沒(méi)有前途,而現(xiàn)在工作沒(méi)有那么枯燥后,人員流動(dòng)沒(méi)有那么頻繁,而且人員培訓(xùn)周期也大為縮短,新手很快就可以進(jìn)入角色,在整個(gè)過(guò)程中,人的價(jià)值就發(fā)揮出來(lái)了”。
向B端發(fā)力,與產(chǎn)業(yè)結(jié)合構(gòu)筑生態(tài)
盡管智能音箱大戰(zhàn)火熱,但不少人始終認(rèn)為,目前AI產(chǎn)品尤其是語(yǔ)音產(chǎn)品還只是一種年輕人的科技玩具,實(shí)用性并不強(qiáng)。
狗尾草創(chuàng)始人、CEO邱楠對(duì)此表示,任何一個(gè)代表未來(lái)方向的科技類(lèi)產(chǎn)品的流行,比如手機(jī)、電腦、智能手表等,一定是從年輕人開(kāi)始。年輕人對(duì)AI有想象力,他們知道自己需要的場(chǎng)景是怎樣的。盡管現(xiàn)有AI技術(shù)還不足夠成熟,但這就和電腦早期發(fā)展一樣,技術(shù)本身是需要時(shí)間去發(fā)展的。當(dāng)年P(guān)C也同樣是從最開(kāi)始的性能不足到后面慢慢被消費(fèi)者接受。
C端產(chǎn)品火過(guò)一陣后,越來(lái)越多的玩家開(kāi)始深入B端,與行業(yè)相結(jié)合。黃勉超說(shuō),C端產(chǎn)品可以戲謔、搞笑的方式與用戶(hù)溝通,當(dāng)用戶(hù)說(shuō)我要在附近找吃時(shí),智能音箱回答不了就會(huì)說(shuō),“哎呀,你是個(gè)吃貨”,但客服語(yǔ)音對(duì)答就不能有絲毫調(diào)侃,用戶(hù)查詢(xún)明天下午3:30是否有飛往大阪的航班,有就是有,沒(méi)有就是沒(méi)有,不可能存在第三個(gè)答案。
不過(guò),整體移動(dòng)互聯(lián)網(wǎng)用戶(hù)增長(zhǎng)見(jiàn)頂,以及BAT等行家也紛紛入局,語(yǔ)音技術(shù)日趨成熟,客戶(hù)變對(duì)手,讓科大訊飛的技術(shù)優(yōu)勢(shì)漸消。但杜蘭認(rèn)為,BAT的到來(lái)會(huì)讓語(yǔ)音技術(shù)變得更好,這片海域是非常寬闊的,并不存在相互競(jìng)爭(zhēng)的問(wèn)題。
而科大訊飛也在加快構(gòu)建一個(gè)融合共享的人工智能產(chǎn)業(yè)生態(tài)。有這樣一個(gè)經(jīng)典的故事:一位四川人石城川,11歲那年高燒因失去聽(tīng)覺(jué),2015年,他發(fā)現(xiàn)科大訊飛有一種語(yǔ)音識(shí)別技術(shù),盡管自己聽(tīng)不到自己的發(fā)音,但是可以通過(guò)這種技術(shù)矯正自己發(fā)音,并識(shí)別正常人的語(yǔ)音轉(zhuǎn)換成文字,這樣就可以實(shí)現(xiàn)自己和正常人的對(duì)話(huà)。在咿咿呀呀的發(fā)音中,他重拾語(yǔ)言能力。后來(lái),他創(chuàng)立了“音書(shū)”App,為聽(tīng)障者和健聽(tīng)者之間建立溝通的橋梁。
目前,科大訊飛開(kāi)放平臺(tái)已為超過(guò)90萬(wàn)開(kāi)發(fā)者提供服務(wù),2018年,共有55.8%的創(chuàng)業(yè)團(tuán)隊(duì)借助科大訊飛技術(shù)實(shí)現(xiàn)創(chuàng)業(yè)夢(mèng)想。
隨著技術(shù)迭代更新越來(lái)越快,語(yǔ)音識(shí)別準(zhǔn)確率方面的提升越來(lái)越難,在眾多玩家之間,競(jìng)爭(zhēng)差距是更大還是更小?“企業(yè)間并不存在太大的技術(shù)差距,早期都是同一個(gè)技術(shù)公司,隨著技術(shù)紅利和技術(shù)壁壘的下降,后期推動(dòng)開(kāi)源,不只是看單一的技術(shù)能力。”邱楠說(shuō),論技術(shù),有哪一家企業(yè)能競(jìng)爭(zhēng)過(guò)中科院?但企業(yè)是給技術(shù)找到技術(shù)場(chǎng)景,在此基礎(chǔ)上不斷延展,競(jìng)爭(zhēng)的維度一定是多元的,語(yǔ)音技術(shù)的壁壘也不會(huì)一直持續(xù)下去。
“我把企業(yè)分成兩大類(lèi),分別是技術(shù)輸出型和產(chǎn)品創(chuàng)新型,前者如谷歌,輸出安卓系統(tǒng);后者如蘋(píng)果,其技術(shù)能力是為自己定義差異化、尋找差異化服務(wù)。”邱楠說(shuō),我給我們的定位就是追求產(chǎn)品的差異化和創(chuàng)新性。
專(zhuān)家點(diǎn)評(píng):智能語(yǔ)音市場(chǎng)整體處于啟動(dòng)期
智能語(yǔ)音是最早落地的人工智能技術(shù)。隨著行業(yè)數(shù)據(jù)資源的積累,深度學(xué)習(xí)算法的進(jìn)步,以及與其他人工智能技術(shù)之間的整合,語(yǔ)音識(shí)別、語(yǔ)義理解、語(yǔ)音合成技術(shù)將取得進(jìn)一步突破,語(yǔ)音交互有望成為新一代人機(jī)交互的主要方式。
目前,國(guó)內(nèi)外幾乎所有的科技巨頭都相繼進(jìn)入了智能語(yǔ)音市場(chǎng),國(guó)外有IBM的Watson、GoogleNow、蘋(píng)果的Siri、微軟的Cortana、Facebook的MessagePlatform、亞馬遜的Aleax等,國(guó)內(nèi)有阿里的天貓精靈、百度的度秘、騰訊的微信語(yǔ)音,以及科大訊飛、華為、小米、云知聲、依圖等發(fā)展的智能語(yǔ)音技術(shù)和產(chǎn)品。據(jù)《2017-2018中國(guó)智能語(yǔ)音產(chǎn)業(yè)白皮書(shū)》的數(shù)據(jù)顯示,2014年至2018年,中國(guó)智能語(yǔ)音產(chǎn)業(yè)規(guī)模由30億元增長(zhǎng)至159.7億元,五年間增長(zhǎng)了五倍。雖然有這么多的科技巨頭和新創(chuàng)AI企業(yè)進(jìn)入智能語(yǔ)音領(lǐng)域,產(chǎn)業(yè)規(guī)模也快速增長(zhǎng),但智能語(yǔ)音市場(chǎng)整體依然處于啟動(dòng)期,智能語(yǔ)音產(chǎn)品和技術(shù)變現(xiàn)尚處于起步階段,真正成熟的語(yǔ)音產(chǎn)品還需要時(shí)間的打磨。
國(guó)家高度重視新一代人工智能產(chǎn)業(yè)的發(fā)展,隨著新一代人工智能發(fā)展規(guī)劃的啟動(dòng)實(shí)施,加快產(chǎn)業(yè)化和應(yīng)用是著力點(diǎn)。工信部將進(jìn)一步推動(dòng)以智能語(yǔ)音為代表的人工智能核心技術(shù)發(fā)展,加強(qiáng)技術(shù)攻關(guān)、促進(jìn)行業(yè)融合應(yīng)用、優(yōu)化發(fā)展環(huán)境,務(wù)實(shí)推動(dòng)智能語(yǔ)音產(chǎn)業(yè)規(guī)模發(fā)展??梢灶A(yù)見(jiàn),隨著行業(yè)應(yīng)用和場(chǎng)景的大規(guī)模切入,智能語(yǔ)音產(chǎn)品將快速迭代,產(chǎn)品的性能和用戶(hù)體驗(yàn)也會(huì)不斷提升,智能語(yǔ)音的發(fā)展大有可期。
評(píng)論