3G 手機(jī)語音識別應(yīng)用中DSP的選擇策略
除了DSP內(nèi)核以外的其他要求
在選中最優(yōu)化的DSP后,要想獲得高性能的ASR用系統(tǒng)級芯片還需要增加一些功能,例如快速緩存或快速指令/數(shù)據(jù)存取以及實時操作系統(tǒng)(RTOS)才能使ASR系統(tǒng)真正完成實時性能。多任務(wù)RTOS能使系統(tǒng)同時運(yùn)行多個應(yīng)用如雙通道語音識別,因此能極大地提高系統(tǒng)性能。
復(fù)雜SoC應(yīng)用(如信道處理系統(tǒng))設(shè)計工程師能從使用高效的高級語言編譯器的DSP和SoC中獲益,因為這些編譯器允許設(shè)計工程師使用C或C++語言進(jìn)行編程。采用增強(qiáng)的片上仿真和調(diào)試功能還可以進(jìn)一步縮短設(shè)計時間。對于3G移動手機(jī)應(yīng)用中各層次的元器件與系統(tǒng)設(shè)計來說,除了實時性能和簡化設(shè)計流程外,功率管理控制同樣非常重要。在設(shè)計SoC時,選擇具有可調(diào)功率功能的內(nèi)核將獲益非淺。例如當(dāng)移動用戶在說話時,DSP需要全速運(yùn)行(如300MHz)。當(dāng)未使用ASR功能時,SoC電源管理電路可以逐步降低到較低的時鐘速度(如100MHz),從而有效地降低漏電和功耗。
由于ASR系統(tǒng)對計算速度的需求會根據(jù)識別特征的差異產(chǎn)生很大變化,例如孤字識別或連續(xù)語音識別、詞匯量和跟講者無關(guān)的語音識別等,因此,能支持ASR功能的信道處理系統(tǒng)的復(fù)雜性變化也很大。
SoC非常適合于構(gòu)造芯片的基礎(chǔ)架構(gòu),因此在以客戶/服務(wù)器系統(tǒng)為中心的設(shè)計中是非常理想的選擇,但SoC器件由于功能太強(qiáng)大,因此并不非常適合于用戶端以終端為中心的設(shè)計。然而,隨著ASR系統(tǒng)的逐漸成熟以及3G手機(jī)支持越來越復(fù)雜的應(yīng)用和復(fù)雜ASR,這類功能強(qiáng)大的SoC也能成功地運(yùn)用到用戶端。
在SoC上使用多個DSP能使系統(tǒng)在完成語音識別的同時更容易地執(zhí)行其它任務(wù)。例如三個內(nèi)核中的一個可以專門指定用來完成多信道的服務(wù)器端ASR,而其它二個內(nèi)核用于執(zhí)行像語音信道和互聯(lián)網(wǎng)數(shù)據(jù)處理這樣的任務(wù)。將來如果手機(jī)鍵盤不復(fù)存在的話,ASR將成為用戶與手機(jī)之間的唯一接口,到時這一功能將占用大部分的工作時間。
采用多個DSP內(nèi)核還能提供強(qiáng)大的計算能力,從而使執(zhí)行非常復(fù)雜的ASR任務(wù)成為可能,如電子郵件聽寫中的連續(xù)語音識別、安全交易和VXML中的“口令+講者驗證”等。多個DSP再加上統(tǒng)一的大型片上存儲器可以極大地縮短跟講者無關(guān)的訓(xùn)練過程,因為在統(tǒng)計型ASR中訓(xùn)練過程的計算負(fù)載比識別處理過程的負(fù)載重得多。
本文小結(jié)
盡管3G手機(jī)要想贏得市場,人們對其功能和設(shè)計仍將拭目以待,但這些系統(tǒng)需要高性能的信號處理平臺以滿足多媒體任務(wù)需求是不容置疑的,而隨著ASR系統(tǒng)的不斷普及,3G手機(jī)肯定需要具備運(yùn)行多任務(wù)能力的多DSP SoC作為解決方案。
評論