高清語(yǔ)音技術(shù)在手機(jī)和藍(lán)牙耳機(jī)中的實(shí)現(xiàn)
高清語(yǔ)音也被稱為寬帶語(yǔ)音,是一種能為蜂窩網(wǎng)絡(luò)、移動(dòng)電話和無(wú)線耳機(jī)傳輸高清、自然語(yǔ)音質(zhì)量的音頻技術(shù)。與傳統(tǒng)的窄帶電話相比,高清語(yǔ)音很大程度上提高了語(yǔ)音質(zhì)量,減少了聽(tīng)覺(jué)負(fù)擔(dān)。
通信產(chǎn)業(yè)鏈上的所有網(wǎng)絡(luò)和設(shè)備都需支持高清語(yǔ)音才能體現(xiàn)出該技術(shù)的優(yōu)點(diǎn)。到2011年6月為止,18個(gè)國(guó)家運(yùn)營(yíng)的20種蜂窩網(wǎng)絡(luò),以及33家領(lǐng)先的手機(jī)品牌都已支持高清語(yǔ)音。通過(guò)部署自適應(yīng)多速率寬帶(AMR-WB)語(yǔ)音編碼,GSM, WCDMA(UMTS)和LTE蜂窩網(wǎng)絡(luò)中已經(jīng)引入了高清語(yǔ)音。此外,通過(guò)使用改良的子帶編碼(mSBC)語(yǔ)音編解碼技術(shù),無(wú)線藍(lán)牙耳機(jī)也開(kāi)始支持高清語(yǔ)音,將免提通話與高語(yǔ)音質(zhì)量結(jié)合在了一起。
高清語(yǔ)音的優(yōu)點(diǎn)同樣可以在現(xiàn)有網(wǎng)絡(luò)中體現(xiàn)出來(lái)。隨著窄帶網(wǎng)絡(luò)和設(shè)備向高清語(yǔ)音過(guò)渡,一種名為帶寬擴(kuò)展(BWE)的語(yǔ)音處理技術(shù)可以用來(lái)在接收終端設(shè)備上模擬類似于高清語(yǔ)音的通話質(zhì)量,為不支持高清語(yǔ)音的設(shè)備提供了一個(gè)折中的解決方案。
從窄帶到高清語(yǔ)音
傳統(tǒng)電話系統(tǒng)的帶寬被限制在大約300Hz到3.4kHz的音頻頻率范圍內(nèi)(圖表1),這一范圍通常被稱為窄帶語(yǔ)音。盡管現(xiàn)在的電話系統(tǒng)是數(shù)字式的,但其還是傳承了與傳統(tǒng)模擬系統(tǒng)相同的帶寬。從語(yǔ)音質(zhì)量的角度來(lái)看,窄帶語(yǔ)音缺乏自然語(yǔ)音保真度,常常被形容為單薄和模糊不清。盡管如此,窄帶頻率范圍內(nèi)完整語(yǔ)句的語(yǔ)音辨別度大概是99%。
圖1:窄帶和寬帶語(yǔ)音的帶寬特點(diǎn)
高清語(yǔ)音在采樣頻率為16kHz時(shí)音頻帶寬大約為50Hz至7kHz,因此與窄帶語(yǔ)音相比具有更清晰的語(yǔ)音信號(hào)。雖然寬帶語(yǔ)音并沒(méi)有顯著提高語(yǔ)音清晰度,但是窄帶范圍之外的3.4kHz至7kHz提高了單詞中的摩擦音(例如f、s和th) 的識(shí)別度。寬帶語(yǔ)音能夠提供更加自然真實(shí)的語(yǔ)音,在主觀音頻質(zhì)量方面比窄帶語(yǔ)音有了顯著的提高。高清語(yǔ)音擴(kuò)展出的50Hz至300Hz的低頻降低了窄帶語(yǔ)音尖細(xì)的特點(diǎn),而擴(kuò)展出的高頻則提高了發(fā)音清晰度。
在主觀語(yǔ)音質(zhì)量聽(tīng)力測(cè)試中,寬帶語(yǔ)音在平均意見(jiàn)得分(MOS)中得到4.5分,而窄帶語(yǔ)音則為3.2分(1分為質(zhì)量差,5分為優(yōu)秀)。寬帶語(yǔ)音質(zhì)量的提高減少了聽(tīng)力負(fù)擔(dān)和聽(tīng)者的疲勞,特別是當(dāng)聽(tīng)者處于嘈雜的環(huán)境下。移動(dòng)網(wǎng)絡(luò)運(yùn)營(yíng)商Orange在其網(wǎng)站上提供了一個(gè)音頻樣本作為高清語(yǔ)音優(yōu)點(diǎn)的例證。2010年6月Orange公司所做的另一項(xiàng)調(diào)查進(jìn)一步向終端用戶證明了高清語(yǔ)音的價(jià)值:
* 96%的客戶對(duì)高清語(yǔ)音通話表示滿意;
* 86%的測(cè)試者表示,兼容高清語(yǔ)音將是他們未來(lái)購(gòu)買手機(jī)時(shí)的一個(gè)選擇標(biāo)準(zhǔn);
* 76%的測(cè)試者愿意更換手機(jī)以獲得高清語(yǔ)音功能。
此外,2006年愛(ài)立信和T-Mobile進(jìn)行的用戶試用調(diào)查也證實(shí)了高清語(yǔ)音的優(yōu)點(diǎn)。在150個(gè)抽樣用戶中,超過(guò)70%的人認(rèn)為使用了高清語(yǔ)音手機(jī)后通話質(zhì)量更好,在嘈雜的環(huán)境中對(duì)話質(zhì)量有所提高。
使用高清語(yǔ)音需要語(yǔ)音通信系統(tǒng)中的所有環(huán)節(jié)都支持寬帶語(yǔ)音頻率范圍。采用高清語(yǔ)音技術(shù)的關(guān)鍵是在蜂窩網(wǎng)絡(luò)和手持電話中協(xié)同部署AMR-WB編解碼。做為一種寬帶語(yǔ)音編碼,AMR-WB的有效音頻帶寬是窄帶編碼AMR-NB的兩倍。要完成一個(gè)高清語(yǔ)音通話,基站和手持電話之間協(xié)同傳輸以AMR-WB編碼的語(yǔ)音,在這一過(guò)程中沒(méi)有進(jìn)行語(yǔ)音修改或從終端到終端的轉(zhuǎn)換編碼。如果高清語(yǔ)音連接無(wú)法實(shí)現(xiàn),系統(tǒng)就會(huì)取而代之使用窄帶AMR-NB編碼。
擴(kuò)展語(yǔ)音帶寬
可以預(yù)計(jì),在引入高清語(yǔ)音的過(guò)程中,通信系統(tǒng)中的某些環(huán)節(jié)會(huì)因無(wú)法支持而將語(yǔ)音轉(zhuǎn)換為窄帶頻率,這實(shí)際上是在降低語(yǔ)音質(zhì)量,增加聽(tīng)力負(fù)擔(dān)。人工帶寬擴(kuò)展(BWE)通過(guò)在通信系統(tǒng)的終端環(huán)節(jié)為窄帶語(yǔ)音信號(hào)加入人工生成的語(yǔ)音內(nèi)容,彌補(bǔ)在傳輸過(guò)程中損失的高頻和低頻語(yǔ)音內(nèi)容。通過(guò)這種方法,BWE將高清語(yǔ)音的優(yōu)勢(shì)拓展到了窄帶和過(guò)渡的混合帶寬的語(yǔ)音通信系統(tǒng)中。
BWE算法使用產(chǎn)生語(yǔ)音的聲源過(guò)濾模型來(lái)估算和產(chǎn)生擴(kuò)展頻率范圍內(nèi)的語(yǔ)音內(nèi)容。根據(jù)該模型,語(yǔ)音是由一個(gè)聲源(例如聲帶)再加上一個(gè)模擬聲道的模型產(chǎn)生的。BWE算法根據(jù)窄帶語(yǔ)音估算出一個(gè)寬帶聲源模型,然后利用該模型的參數(shù)估算出其丟失的寬帶頻率內(nèi)容。在實(shí)際應(yīng)用中,BWE獨(dú)立于源編碼和發(fā)送路徑處理過(guò)程的,因此它可以與傳統(tǒng)的窄帶和混合帶寬的電話網(wǎng)絡(luò)共存。
評(píng)論