深度探討高清音頻IC設(shè)計難題
編碼流可使用DTS 5.1編碼器或杜比數(shù)字5.1編碼器,而編碼必須把數(shù)據(jù)以壓縮的格式傳送給一個兼容的音頻/視頻接收器(比如經(jīng)由S/PDIF電纜)。混合信號在發(fā)送給揚聲器之前可能需要后處理功能,以補償聲音失配播放環(huán)境或各種不同的音頻不完整性。
圖2 5.1編碼系統(tǒng)
在設(shè)計高清音頻IC時,有若干因素需要考慮。高清音頻最重要的特性是數(shù)據(jù)流量,因為相比傳統(tǒng)的音頻應(yīng)用,高清音頻數(shù)據(jù)流量大大提高。僅對 I/O而言,這種數(shù)據(jù)流量在某些編解碼器就可能達到24.5Mb/s的輸入速率和在27.6Mb/s的輸出速率下達致每秒96kHz×8×24位的輸出。這就需要一種新的IC設(shè)計方案來確保這些挑戰(zhàn)得到解決,同時保證音頻的質(zhì)量。
另外,一些采樣頻率達192kHz、帶6個或8個聲道,并且運算精度很高的無損音頻編解碼器,如DTS-HD主音頻或杜比TrueHD,它們的計算要求極高。如果不予以改進,單單一個編解碼器就可能消耗掉傳統(tǒng)DSP的全部MHz預(yù)算。
性能要求
如上所述,高清音頻實現(xiàn)方案(如藍光光盤應(yīng)用)的數(shù)據(jù)處理要求非常高。在如此高的數(shù)據(jù)率下,很多現(xiàn)有的單核DSP解決方案都無法保證高質(zhì)量的數(shù)據(jù)處理,故業(yè)界不少解決方案開始傾向于采用能夠滿足視頻結(jié)合音頻的處理開銷要求的雙內(nèi)核方案。
而且,在DSP解決方案的實現(xiàn)中,除了強制性及可選音頻編解碼器之外,還需要許多后處理功能,而這些后處理功能正是眾多實現(xiàn)方案的差異化因素。由于在處理最小的高清音頻編解碼器時,許多單核DSP都會有過載的情況,所以幾乎沒有什么剩余能力可言,即便有,也差不多都是用于強制性后處理。
芯片尺寸/功耗考慮
由于制造商和設(shè)計人員不得不應(yīng)對挑戰(zhàn),把所有必要的處理功能全部塞入尺寸越來越小的芯片中,這使現(xiàn)有的芯片尺寸也面臨著巨大的壓力。采用多核解決方案雖然可以提供這些處理能力,但芯片尺寸、相應(yīng)的價格增加和驅(qū)動子系統(tǒng)所需的電能之間的權(quán)衡都可能往往令人望而卻步。特別在滿足具有特殊功率和外形尺寸限制的高清設(shè)備(如便攜游戲機)要求時,這一點尤其關(guān)鍵。
即使對于非移動設(shè)備,功耗也是一個重要的考慮因素,因為它影響到設(shè)備的散熱性能。較高的功耗可能需要某些冷卻手段,從而對產(chǎn)品的總體設(shè)計造成影響。
任務(wù)切換的存儲器交換
高清音頻系統(tǒng)中必須執(zhí)行大量并行任務(wù),故需要非常頻繁的存儲器交換。這些交換必然會致使存儲器帶寬過載,讓系統(tǒng)無法處理增加的總線流量,最終快速降低音質(zhì)。另外因為指令集常常采用32位格式編寫,這又使得指令更大,指令間間隔更長,進一步加劇數(shù)據(jù)過載問題,而16位指令集可以減輕這種負載。在數(shù)據(jù)方面,某些高清音頻編解碼器需要100Kb以上的數(shù)據(jù)RAM外加相當大的數(shù)據(jù)表,也就是強制要求利用存儲器交換以高效利用RAM存儲器。
慢速外部存儲器存取OUND-COLOR: rgb(255,255,255); orphans: 2; widows: 2; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px> 許多在DSP上運行的音頻算法傳統(tǒng)上均以非序列(non-sequential)的方式對大容量緩存進行存取。一般而言,這些緩存都太大,無法駐留在處理器的片上存儲器中,故它們必須置于速度較慢的外部存儲器中,如DDR SDRAM。另外,非序列存取也給維持高性能的目標帶來一個挑戰(zhàn)。由于音頻解碼器常常與視頻解碼器爭奪數(shù)據(jù)總線吞吐量,故存儲器存取效率非常重要。要提供高質(zhì)量的音頻體驗,就必須解決這個難題以實現(xiàn)穩(wěn)定的性能。
解決難題
要解決影響高清音頻DSP領(lǐng)域的眾多問題,需要一個基于功能強大的數(shù)字信號處理器的系統(tǒng),其中應(yīng)包括合適的軟件和外設(shè)。CEVA-HD-Audio就是這種高清音頻系統(tǒng)的實例,它是一個全面完善的單核DSP解決方案,能夠滿足最嚴苛的高清音頻使用案例的要求。
CEVA-HD-Audio是基于CEVA-TeakLite-III DSP內(nèi)核的系統(tǒng)。CEVA-TeakLite-III擁有本地32位處理能力和雙乘法累加(Multiply-Accumulate, MAC)架構(gòu),是需要先進音頻標準的高清音頻應(yīng)用的理想DSP方案。另外,CEVA-TeakLite-III還具有良好平衡的10級管線,使其內(nèi)核在65nm工藝下的運作頻率仍超過550MHz(在最差條件和工藝)。CEVA-HD-Audio集成了一個帶有32位寄存器文件、64位數(shù)據(jù)存儲帶寬、32×32位乘法器和自動32位飽和的本地32位SIMD DSP處理器。CEVA-TeakLite-III還具有一個帶有完善MAC指令集的雙16×16 MAC,可實現(xiàn)語音/VoIP和全面的流處理位操作(bit-manipulation)功能,這對流處理十分有用。除了帶有多精度點的固有32位數(shù)據(jù)處理功能之外,單周期32位MAC單元還包括用于無損編解碼器的72位MAC累加,和獨特的單精度與雙精度FFT蝶形指令(butterfly instruction),以及一個2/4周期內(nèi)核。
圖3 CEVA TeakLite-III結(jié)構(gòu)框圖
CEVA-TeakLite-III架構(gòu)嵌入了CEVA-Quark指令集,是全面的獨立式嵌入緊湊型指令集架構(gòu)(ISA)。這種獨特的ISA旨在僅利用16位指令,減小芯片的尺寸和成本,同時降低功耗,減少存儲器存取次數(shù)。CEVA-Quark ISA是一套完整的指令,包括存儲器存取、算術(shù)與乘法運算、邏輯、移位和流處理位操作指令以及控制操作。應(yīng)用程序開發(fā)人員還可以把CEVA-Quark指令與其他更先進的CEVA-TeakLite-III指令相混合,無須切換到不同的運作模式。這種組合特性可使代碼量減少4倍,周期數(shù)減少了近9倍。
利用單核實現(xiàn)高性能高清音頻
上面提到的處理效率,顯示CEVA-TeakLite-III能夠利用單核DSP,輕松提供完整的高清音頻支持。由于它擁有更小的存儲器,所以尺寸更小,性能更高,比市場上其他競爭解決方案更為優(yōu)勝。單核實現(xiàn)方案也意味著不論從硬件還是軟件的角度來看,應(yīng)用開發(fā)和集成都更為容易。
評論