基于C6000系列DSP的MPEG-4編碼器實現(xiàn)
·可以將兩個16位數(shù)據(jù)或者四個8位數(shù)據(jù)合并成一個32位數(shù)據(jù),以提高存取效率;
·必須靜態(tài)地知道每條操作指令執(zhí)行需要的時鐘周期,這樣才能取得該操作的正確結(jié)果;
·這種結(jié)構(gòu)的處理器不能處理動態(tài)事件,例如Cache突然消失;
·對于多周期才能完成的指令,在正確計算的基礎(chǔ)上,一定要提前執(zhí)行,以免出現(xiàn)一條指令必須等上一條指令執(zhí)行結(jié)束才能執(zhí)行的情況。
下面結(jié)合C6000系列DSP的指令及其具體資源情況,以MPEG-4中的算法為例說明如何利用這兩種結(jié)構(gòu)設(shè)計出高效的代碼。
3.1 利用流水線結(jié)構(gòu)設(shè)計程序
流水線是指指令的處理可分為幾個子操作,每個子操作由不同的單元完成。對每個單元來說,每隔一個時鐘周期可進入一條新指令,在同一時間內(nèi)不同單元可以同時處理多條指令。在C6000中B(.unit)lable是一條跳轉(zhuǎn)指令,它的執(zhí)行周期為7個時鐘周期,也就是說,在安排這條指令之后6個時鐘周期才能使程序轉(zhuǎn)移到lable處執(zhí)行,以程序1為例說明如何利用流水線結(jié)構(gòu)設(shè)計程序。該程序的執(zhí)行順序如下:0000→0004→0008→000C-0010→0014→0008→000C...從程序執(zhí)行順序知道,要想在執(zhí)行完0014處的指令后跳轉(zhuǎn)到LOOP處,就應(yīng)該在0014的前6個時鐘周期處安排這條指令;如果不提前安排好這條指令,而是在0014后放置這條指令,就需要使CPU等待6個時鐘周期才能跳到LOOP處,從而使程序運行效率降低。從這個程序的執(zhí)行順序可以看出,必須提前知道每一條指令的運行周期數(shù),并提前安排該指令,才能達到減少等待周期、提高程序效率的效果。C6000系列DSP指令集包括許多多時鐘周期的指令,如跳轉(zhuǎn)指令、數(shù)據(jù)訪問指令等。MPEG-4編碼算法需要頻繁地訪問大量數(shù)據(jù),并且有很多循環(huán),無論是數(shù)據(jù)訪問還是循環(huán)都要用到多時鐘周期指令。以MEPG-4的DCT算法為例,每一個8×8的塊變換需要用16次的跳轉(zhuǎn)指令和256次數(shù)據(jù)訪問指令,由此可見流水線在MPEG-4程序優(yōu)化中所起的作用。
評論