騰訊開放天籟AI降噪技術(shù),“科技公益互助計劃”首個場景落地
伴隨數(shù)字時代的全面到來,科技助力公益已成為行業(yè)趨勢,數(shù)字科技也正在成為社會公益事業(yè)發(fā)展的新引擎。
本文引用地址:http://cafeforensic.com/article/202009/418851.htm作為“科技公益互助計劃”的首個落地場景,值9月27日國際聾人日之際,騰訊多媒體實驗室聯(lián)合騰訊公益慈善基金會、深圳市信息無障礙研究會等機構(gòu)召開發(fā)布會,宣布發(fā)起“天籟行動”,通過面向公益開發(fā)者、設備廠商、NGO及行業(yè)免費開放騰訊天籟AI音頻技術(shù),幫助聽障人群解決“聽不清”難題,并邀請歌手周深作為公益大使,呼吁全社會關(guān)注聽障人士身心康復,構(gòu)建信息無障礙環(huán)境。本次“天籟行動”發(fā)起,也是騰訊繼AI尋人、守護者計劃等項目實踐后,又一個“科技向善”落地的典型案例。
發(fā)布會上,騰訊多媒體實驗室高級總監(jiān)商世東直言,在過去與聽障人群的多次接觸中,他了解到一些聽障人群花費高昂的費用安裝了人工耳蝸,但在機場、商場等比較嘈雜的公共環(huán)境中,依然面臨著“聽不清”的困擾。
基于此,商世東和團隊萌生了通過AI算法改善聽障人群聽覺體驗的想法,并找到了國內(nèi)最大的人工耳蝸廠商之一——諾爾康(Nurotron),雙方一起討論在當前人工耳蝸軟硬件局限條件下的解決方案,經(jīng)過長達半年的技術(shù)驗證,從架構(gòu)上最終確定了“手機伴侶+人工耳蝸”的聯(lián)合解決方案。
據(jù)諾爾康實驗檢測數(shù)據(jù)顯示,天籟技術(shù)與人工耳蝸結(jié)合后,語音識別性能大幅提升,平均識別率達到96.28%,其中帶噪語音識別率為93.38%,環(huán)境噪音中聲音識別率達到94.24%;在手機App中植入天籟技術(shù),手機雙麥陣列降噪的信噪比提升 20dB,MOS分提升了0.3-0.5,對于改善聽障人群聽覺體驗有著積極效果。
除此之外,騰訊優(yōu)圖實驗室此前還利用深度學習技術(shù),突破“跨年齡人臉識別”,助力警方尋回被拐十年兒童。對此,騰訊表示,公司希望充分發(fā)揮技術(shù)的社會價值,讓AI給社會帶來更多可能。
實際上,據(jù)商世東介紹,作為新一代實時音頻技術(shù),騰訊天籟同時也是騰訊會議背后的關(guān)鍵技術(shù),致力于讓用戶在實時音視頻會議中可以“聽得見、聽得清、聽得真”。騰訊會議通過嵌入騰訊天籟技術(shù),解決了實時音視頻會議場景下的各種挑戰(zhàn)。
商世東曾在9月11日的騰訊全球數(shù)字生態(tài)大會視頻通信云專場上指出,與傳統(tǒng)會議場景相比,實時音視頻的云視頻會議面臨著非常大的挑戰(zhàn)。主要包括以下幾個方面:音頻外設的多樣化(客戶端,高清音質(zhì))、網(wǎng)絡條件差異(Ethernet,4G,W i f i)、聲學環(huán)境復雜(遠距離/混響/本底噪聲)、入會形式復雜(同地多設備)、噪聲類型多變(平穩(wěn),非平穩(wěn)噪聲)、客戶端的音頻設備差異性(藍牙,有線,內(nèi)置)、與傳統(tǒng)會議設備的兼容、用戶需求的多樣化(音頻內(nèi)容分享)及現(xiàn)網(wǎng)質(zhì)量評估的復雜性。而天籟音頻技術(shù)是實時端到端音頻通信的完整解決方案。
目前,天籟音頻技術(shù)規(guī)劃的關(guān)鍵策略包括音頻通信核心體驗、聲音場景分類和處理、音頻痛點難點問題及差異化體驗,最終目標則是提升語音可懂度、自然度、舒適度。
統(tǒng)計數(shù)據(jù)顯示,疫情期間,搭載騰訊天籟技術(shù)的騰訊會議,不僅為企業(yè)之間構(gòu)筑了溝通通道,加速了復工復產(chǎn),更在經(jīng)濟層面創(chuàng)造了巨大的價值與貢獻。得益于天籟技術(shù)的加持,騰訊會議上線兩個月內(nèi)日活用戶就超過1000萬,目前用戶規(guī)模已經(jīng)突破1個億,國際版應用也在全球100多個國家和地區(qū)上線,助力全球抗擊疫情。據(jù)北京大學互聯(lián)網(wǎng)發(fā)展研究中心發(fā)布的報告顯示,今年1月至5月期間,騰訊會議直接節(jié)約社會成本達到714億元。
商世東表示,未來,騰訊將投入更多技術(shù)力量,與公益伙伴攜手,推動公益行業(yè)深耕透明度、數(shù)字化、生態(tài)效率,持續(xù)探索從科技向善到科技公益互助模式的延展,不斷擴展公益生態(tài)的廣度和深度。
評論