請(qǐng)給我一個(gè)安全的語(yǔ)音助手!
請(qǐng)給我一個(gè)安全的語(yǔ)音助手!
本文引用地址:http://cafeforensic.com/article/201805/379515.htm這句話好像有點(diǎn)像在發(fā)牢騷。但是伴隨著越來(lái)越多的語(yǔ)音助手、智能音箱的普及使用,這似乎也成為一個(gè)迫切的需求。
前兩天在抖音上看到了一個(gè)好玩的事兒,有美女用她男同事的手機(jī)像另一個(gè)女同事表白。最開(kāi)始我還,趕緊掏出我的手機(jī),找了個(gè)女同事實(shí)驗(yàn)了一下,結(jié)果是真的。
這雖然是個(gè)搞笑視頻,但是也暴露出一些值得我們反思的問(wèn)題:
我的語(yǔ)音助手,真的安全嗎?
還記得在小米社區(qū)看到,有這樣一個(gè)事兒:
一個(gè)用戶在小米社區(qū)發(fā)帖求助“小愛(ài)在我不在家的時(shí)候安全性,被別人一句話智能操作執(zhí)行命令了怎么辦”,你不要覺(jué)得這個(gè)危言聳聽(tīng),但凡有小米音響的,應(yīng)該都遇到這樣的狀況,明明是自己的音響,但是它不認(rèn)識(shí)自己的主人。
所以有人基于此開(kāi)玩笑的說(shuō),說(shuō)以后犯罪不用帶面具了,因?yàn)樗贿M(jìn)門(mén)就可以說(shuō):XXX,請(qǐng)幫我關(guān)閉所有的攝像頭。
其實(shí),用過(guò)小米音箱的人可能都知道:小米音箱在語(yǔ)音分析上已經(jīng)做的很不錯(cuò),但是在聲紋識(shí)別上,目前還是空白的。換句話講:現(xiàn)在很多語(yǔ)音助手、智能音箱以及各種語(yǔ)音產(chǎn)品,已經(jīng)能聽(tīng)的到和理解說(shuō)什么了,但是他不知道誰(shuí)是他的主人,所以任何人都可以對(duì)他發(fā)號(hào)施令。
當(dāng)然,這里其實(shí)涉及到了2種技術(shù):一個(gè)是語(yǔ)音識(shí)別,一個(gè)是聲紋識(shí)別。
語(yǔ)音識(shí)別就比較好理解,而且我們應(yīng)用的也更多。機(jī)器通過(guò)識(shí)別和理解過(guò)程把語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令。最常見(jiàn)的就是,微信發(fā)個(gè)語(yǔ)音可以直接轉(zhuǎn)成文字。除了我們常見(jiàn)的社交軟件上的應(yīng)用外,人機(jī)交互、導(dǎo)航、檢索、還有前幾天翻車(chē)的騰訊同傳,這里面都會(huì)涉及到語(yǔ)音識(shí)別技術(shù)。
聲紋識(shí)別,其實(shí)也不是什么新的概念。大家或多或少的也都有接觸,如果我換一個(gè)說(shuō)法,人臉或者指紋的話,這樣你是不是就覺(jué)得好理解很多了,現(xiàn)階段基于人臉是別的各種身份認(rèn)證已經(jīng)被廣泛應(yīng)用,如蘋(píng)果手機(jī)、銀行取款等。(但是我不得不吐槽下,為什么我敷面膜,還能打開(kāi)我的手機(jī)呢。這到底是識(shí)別準(zhǔn)確還是技術(shù)問(wèn)題,真的是一個(gè)很模糊的界定了。)而聲紋識(shí)別,其實(shí)跟人臉識(shí)別或者指紋識(shí)別一樣,都是生物識(shí)別的一種,可以應(yīng)用的場(chǎng)景也是非常多的了。
而且,這是一個(gè)目前被低估的市場(chǎng),但是隨著國(guó)家大力發(fā)展智能語(yǔ)音平臺(tái),越來(lái)越多的公司以及技術(shù)團(tuán)隊(duì)將會(huì)關(guān)注這個(gè)領(lǐng)域。聲紋識(shí)別在所有的生物識(shí)別技術(shù)里,用戶接受度最高,而且易用性、準(zhǔn)確性不輸于人臉識(shí)別,甚至在身份驗(yàn)證方便表現(xiàn)更為出色。國(guó)內(nèi)曾經(jīng)有人做過(guò)實(shí)驗(yàn),他們找了23對(duì)雙胞胎,而且是同卵雙胞胎的語(yǔ)音數(shù)據(jù),專(zhuān)家去聽(tīng),大概分辨準(zhǔn)確率是85%,而通過(guò)機(jī)器進(jìn)行聲紋測(cè)試,100%全區(qū)分開(kāi)了。
所以,上面說(shuō)了那么多,我們用一句話就可總結(jié):語(yǔ)音識(shí)別解決了你說(shuō)什么的問(wèn)題,而聲紋識(shí)別解決你是誰(shuí)的問(wèn)題。
那么聲紋識(shí)別,都有那些應(yīng)用場(chǎng)景呢?
1.身份識(shí)別
其實(shí)隨著互聯(lián)網(wǎng)的發(fā)展,我們可能都感覺(jué)到,傳統(tǒng)的數(shù)字密碼保密性以及安全性不夠,而且眾多復(fù)雜的密碼也難于記憶,特別是隨著平臺(tái)增多,不身份驗(yàn)證變得越來(lái)越繁瑣。而利用 “生物特征”來(lái)進(jìn)行驗(yàn)證就成了很好的解決方案,由于每個(gè)人的指紋、面部、瞳孔、聲音等特征都不相同,具有唯一性, “活體密碼”的安全性也無(wú)疑會(huì)高出許多。而聲紋又以交互自然、具有內(nèi)容變化和使用成本低等特點(diǎn)從眾多的可選方案中脫穎而出,逐漸成為身份識(shí)別領(lǐng)域的一匹“黑馬”。
2.移動(dòng)支付
這個(gè)使用場(chǎng)景其實(shí)大家很多也都接觸過(guò)了。
現(xiàn)在某些金融類(lèi)APP已經(jīng)開(kāi)始進(jìn)行聲紋識(shí)別認(rèn)證了。此外,如果你擁有一臺(tái)天貓精靈的話,恰巧你也在上面購(gòu)買(mǎi)過(guò)東西的話,是不是覺(jué)得語(yǔ)音控制,未來(lái)可期呢。
值得說(shuō)的是,天貓精靈已經(jīng)加入聲紋識(shí)別技術(shù),也就是說(shuō)有且僅有你才能控制天貓精靈,不用擔(dān)心會(huì)有人通過(guò)語(yǔ)音控制你的寶貝,而讓錢(qián)包丟失的問(wèn)題了。
3.工業(yè)預(yù)警
工業(yè)機(jī)器的良好能否運(yùn)行對(duì)一個(gè)企業(yè)至關(guān)重要,簡(jiǎn)單來(lái)說(shuō),如果我們能在機(jī)器完全出故障之前確定機(jī)器問(wèn)題,能將企業(yè)損失降至最低。
以工廠發(fā)動(dòng)機(jī)為例,在機(jī)器正常運(yùn)轉(zhuǎn)之際發(fā)出的聲音,肯定和其有故障的時(shí)候發(fā)出的聲音是不一致的,根據(jù)周?chē)h(huán)境,提取固定聲音,將采集聲音進(jìn)行智能分析,提取工業(yè)機(jī)械中的聲音特征,通過(guò)聲音大數(shù)據(jù)分析辨別機(jī)器是否正常運(yùn)轉(zhuǎn),并根據(jù)聲音頻率,推測(cè)機(jī)器的運(yùn)行狀況。
其實(shí),聲紋可以應(yīng)用的場(chǎng)景還有很多,比如電子病例、智能汽車(chē)的權(quán)限控制等等。隨著技術(shù)的普及以及落地,越來(lái)越多的應(yīng)用場(chǎng)景被擴(kuò)展開(kāi)發(fā),相信不久將來(lái),我們可以看到更多使用場(chǎng)景的出現(xiàn)。
那么國(guó)內(nèi)有哪些專(zhuān)業(yè)做聲紋的公司呢?
注意,我這里說(shuō)的是聲紋公司而不是語(yǔ)音公司。舉個(gè)例子,科大訊飛現(xiàn)在也聲紋上頗有研究,但是他之前確實(shí)是個(gè)不折不扣的語(yǔ)音技術(shù)公司。類(lèi)似的還有思必馳,更多的都是偏向語(yǔ)義分析、語(yǔ)音識(shí)別、語(yǔ)音理解等技術(shù)。
類(lèi)似于北京君林科技股份有限公司,面向全球,提供最領(lǐng)先的音頻領(lǐng)域解決方案和專(zhuān)業(yè)服務(wù),基于聲學(xué)推動(dòng)人工智能技術(shù)產(chǎn)品落地。公司以打造人工智能領(lǐng)域的音頻硬件平臺(tái)及系統(tǒng)平臺(tái),使君林技術(shù)成為人工智能音頻領(lǐng)域不可或缺的環(huán)節(jié)為發(fā)展目標(biāo)。并以此為基礎(chǔ),全面覆蓋聲學(xué)技術(shù)-固件算法-智能硬件-系統(tǒng)驅(qū)動(dòng)-云服務(wù)-大數(shù)據(jù)-Ai技術(shù)等技術(shù)鏈。君林科技擁有一整套完整的聲音處理系統(tǒng)解決方案。用戶可以使用已有或者定制的音頻數(shù)據(jù)采集方案,通過(guò)君林科技聲紋REST API上傳至云端,由人工智能算法進(jìn)行建模,識(shí)別與認(rèn)證,有效為企業(yè)創(chuàng)造最大價(jià)值。公司有聲學(xué)、無(wú)線音頻、AI聲學(xué)、聲紋技術(shù)、云端和大數(shù)據(jù)等核心技術(shù)、產(chǎn)品解決方案設(shè)計(jì)會(huì)議、汽車(chē)、社保、公安、智能硬件等多個(gè)領(lǐng)域。
評(píng)論