色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

          新聞中心

          EEPW首頁 > 嵌入式系統(tǒng) > 設計應用 > 基于TMS320C6201的G.723.1多通道語音編解碼的實現(xiàn)

          基于TMS320C6201的G.723.1多通道語音編解碼的實現(xiàn)

          作者: 時間:2008-06-02 來源:嵌入式開發(fā)網(wǎng) 收藏

            3.1.2 提高寄存器的利用率

          本文引用地址:http://cafeforensic.com/article/83480.htm

            芯片內(nèi)部的運算單元運行效率非常高,但如果寄存器和數(shù)據(jù)總線之間的數(shù)據(jù)交換頻繁,將使的執(zhí)行效率大打折扣。因為在進行內(nèi)存操作時,往往需要若干周期的延遲,如Load指令要有4個周期的延遲,Store指令需要2個周期的延遲。為了減少耗時的內(nèi)存操作,可以在程序進入循環(huán)體之前,將要頻繁使用的數(shù)據(jù)預先放入寄存器,然后反復調(diào)用,實踐證明這種方法可以提高一部分效率。

            3.1.3 使用內(nèi)在函數(shù)(Intrinsic)

            內(nèi)在函數(shù)是在某些C6201DSP的匯編指令前加上“_”構成它可以方便地實現(xiàn)某些需若干C語句才能實現(xiàn)的功能。它是一種非常簡便高效的優(yōu)化方法,它的調(diào)用格式和普通C函數(shù)一樣,但在編譯時編譯器會自動將Intrinsic用對應的匯編指令替代。C6201指令集中絕大多數(shù)的運算邏輯指令都可以這樣使用,比如飽和絕對值、飽和加、飽和減、飽和乘、兩個字中的對應半字同時加或同時減、兩個字中的對應半字同時乘或交叉乘、歸一化及位操作等。經(jīng)過此步優(yōu)化后,大部分循環(huán)體都可以生成較為有效的流水內(nèi)核(piplinedkernel)。用Intrinsic替代G.723.1原先的C代碼,運算量下降為原來的1/10。

            3.1.4 對算法的冗余部分合理精簡

            經(jīng)過檢查,發(fā)現(xiàn)ITU-T G.723.1的C代碼存在冗余部分。象6.3k碼率的MP-MLQ搜索模塊中,只需要用到偶數(shù)位置的脈沖響應的自相關,所以對奇數(shù)位置的脈沖響應自相關計算可以省略。

            另外,在G.723.1標準中存在大量的10階FIR和10階IIR濾波器運算,如編碼部分的感知加權、零輸入響應、解碼部分綜合濾波器和后濾波等,FIR和IIR的通用形式可以表示為:

            每次循環(huán),FIR濾波器內(nèi)存要用新的輸入值更新,IIR濾波器內(nèi)存要用新的輸出值更新,使用按標準提供的算法,要專門用一個10階循環(huán)更新內(nèi)存。如果用一個10單位大小的循環(huán)緩存區(qū),每次用新值覆蓋最老的樣值,動態(tài)調(diào)整循環(huán)緩存區(qū)的頭指針,可以節(jié)省原先用于內(nèi)存更新的cycle。

            3.2 匯編級優(yōu)化

            由于C編譯器只能完成70%的工作且對于復雜的循環(huán),C編譯器無法生成高效率的代碼,所以對運算量大的模塊只能用手寫匯編。

            3.2.1 字長優(yōu)化

            C6201的字長為32位,它支持按字節(jié)、半字、字存取。對于16位的數(shù)組,當它在內(nèi)存中連續(xù)排列時,用32位讀寫指令LDW或STW替代16位讀寫指令LDH或STH,循環(huán)次數(shù)可減少一半。另外,C6201的匯編指令支持兩個32位寄存器的高16位和低16位之間互乘,結果分別放到不同的寄存器中,互不影響。具體指令為SMPY(L×L)、SMPYH(H×H)、SMPYHL(H×L)和SMPYLH(L×H)。通過字長優(yōu)化,可以大大提高程序的運行效率。必須注意的是,在使用字長優(yōu)化時,數(shù)組在內(nèi)存中的位置必須對齊32位邊界。

            3.2.2 對外循環(huán)的優(yōu)化

           ?。茫叮玻埃钡模镁幾g器對多重循環(huán)的最內(nèi)層一般能較好地優(yōu)化到一句到兩句,但對外循環(huán)的優(yōu)化效率則差很多。手寫匯編時,可以先將內(nèi)循環(huán)展開,再把外循環(huán)的指令并入其中,可以減少所耗費的cycle數(shù)。

           ?。茫叮玻埃钡难h(huán)一般分前導(Prolog)、內(nèi)核(Kernel)及排空(Epilog)三部分。代碼的并行程度從Prolog開始不斷提高,Kernel內(nèi)的并行程度最高,Epilog與Prolog相反,并行性逐漸降低。在多重循環(huán)中,如果盡量把內(nèi)循環(huán)前導部分的指令與填入排空部分未用的單元,一起執(zhí)行,可以在執(zhí)行本次循環(huán)的排空語句的同時執(zhí)行下次循環(huán)的前導語句。這樣可不多花cycle而提高整個循環(huán)的效率。

            4 實現(xiàn)結果

            經(jīng)過C語言級和匯編級的多種優(yōu)化,最后實現(xiàn)了一路G.723.1的編解碼需要花費10.6MCPS,整個代碼的程序空間為208K byte(程序中包括了部分c6201的庫函數(shù)),數(shù)據(jù)空間為8K byte,碼本大?。玻埃?byte,多通道的上下文數(shù)據(jù)為1.48K byte。200MHz的C6201每秒可以實時編解碼16路語音信號。所有代碼全部通過了ITU-T測試矢量的測試。表1是各主要模塊的運算量。

          表1 G.723.1各主要模塊運算量

            本文提出的利用C6201 DSP進行ITU-T G.723.1全雙工實時多通道語音編解碼的實現(xiàn)。該實現(xiàn)可以在IP電話、視頻會議中得到廣泛應用。


          上一頁 1 2 下一頁

          評論


          相關推薦

          技術專區(qū)

          關閉