獨立于硬件技術(shù)的XC166單片機的DSP程序優(yōu)化方法
XC166單片機的指令流水線存在著不可避免的阻塞現(xiàn)象,MAC單元指令也一樣。盡管在硬件設(shè)計時已經(jīng)采用了專用模塊來減少阻塞,但有些阻塞是不可避免的,從程序優(yōu)化的角度來說,可以充分利用指令流水線阻塞現(xiàn)象,通過重排指令流水線上的指令,消除阻塞,以使得程序的運行時間縮短,從而達到優(yōu)化的目的。
本文引用地址:http://cafeforensic.com/article/172110.htm通常DSP優(yōu)化方法可以分為兩類:一類是與芯片相關(guān)的,另一類是與芯片無關(guān)的。與芯片無關(guān)的優(yōu)化方法獨立于單片機硬件,適用于所有單片機及DSP處理器,下面根據(jù)使用XC166單片機的經(jīng)驗總結(jié)一些優(yōu)化DSP程序的方法。
1 通用優(yōu)化方法
1.1 數(shù)據(jù)組處理
數(shù)據(jù)組處理的基本思想是通過成組的處理數(shù)據(jù),以節(jié)約每次調(diào)用處理子程序所需的附加指令。數(shù)據(jù)組處理可以在C語言或匯編語言程序中實現(xiàn)。一般而言,對于開發(fā)DSP程序,最常用的程序語言為C和匯編。下面分別介紹如何在C和匯編程序中使用數(shù)據(jù)組處理優(yōu)化方法。
(1)C程序
在C環(huán)境中開發(fā)DSP程序,通常算法本身由匯編編寫,以便優(yōu)化實現(xiàn)。C主程序通過調(diào)用匯編實現(xiàn)的核心處理子程序來完成對數(shù)據(jù)的處理。核心處理子程序有兩種實現(xiàn)方法,一種是數(shù)組處理,另一種是單值處理,假設(shè)單值處理子程序的核心部分與數(shù)組處理子程序的核心部分所需機器周期相同,并且調(diào)用子程序的前期處理需M個機器周期,后期處理需要N個機器周期,如果子程序被調(diào)用K次,那么理想情況下,數(shù)據(jù)組處理可以節(jié)約(K-1)(M+N)個機器周期,如圖1所示。
(2)匯編程序
在匯編程序中實現(xiàn)數(shù)據(jù)組處理有多種方法,比如數(shù)組操作,數(shù)組讀入/寫出等。
1、數(shù)組操作。數(shù)組操作是將多個不同的短操作數(shù)裝入一個長位數(shù)的寄存器,然后進行運算操作。比如,1個16位的寄存器可以裝入2個8位的來自A/D轉(zhuǎn)換器的數(shù)據(jù)。下面舉例說明數(shù)據(jù)組處理在匯編程序中的應(yīng)用。
2、數(shù)組讀入寫出。這種方法是將多個短操作數(shù)合并為一個長操作數(shù)后進行讀入/寫出操作,如上面例子中的輸入/輸出部分。
1.2 數(shù)據(jù)存儲器交織
數(shù)據(jù)存儲器交織的目的是通過重新排列數(shù)據(jù)在存儲器中的位置,以使得程序讀寫數(shù)據(jù)的時間最短,比如有2個8位的復(fù)數(shù)x和y,一般情況下,復(fù)數(shù)將按下列順序存入內(nèi)存:real(x),image(x),real(y),image(y)。但如果想使得讀取復(fù)數(shù)的實部更容易,可以把數(shù)據(jù)重新排列如下:real(x),real(y),image(x),image(y),如圖2所示。
1.3 循環(huán)展開
循環(huán)展開是一種非常傳統(tǒng)的程序優(yōu)化方法,可以用于所有程序優(yōu)化中,循環(huán)展開的目的是通過重復(fù)循環(huán)中的程序,減少循環(huán)次數(shù),從而減少循環(huán)判斷指令的執(zhí)行次數(shù),以此來降低程序執(zhí)行所需的機器周期,下面舉一個例子來說明循環(huán)展開在XC164CS單片機中的應(yīng)用。
評論