基于算法的DSP硬件結(jié)構(gòu)分析
在當(dāng)前信息化、數(shù)字化進(jìn)程中,信號作為信息的傳輸和處理對象,逐漸由模擬信號變成數(shù)字信號。信息化的基礎(chǔ)是數(shù)字化,而數(shù)字化的核心技術(shù)之一就是數(shù)字信號處理。數(shù)字信號處理技術(shù)已成為人們?nèi)找骊P(guān)注的并得到迅速發(fā)展的前沿技術(shù)。DSP作為一種特別適合于進(jìn)行數(shù)字信號處理運(yùn)算的微處理器,憑借其獨(dú)特的硬件結(jié)構(gòu)和出色的數(shù)字信號處理能力,廣泛應(yīng)用于通訊、語言識別、圖像處理、自動(dòng)控制等領(lǐng)域。
2DSP算法的主要特點(diǎn)及其硬件要求
數(shù)字信號處理是指將模擬信號通過采樣進(jìn)行數(shù)字化后的信號進(jìn)行分析、處理、它側(cè)重于理論、算法及軟件實(shí)現(xiàn)。數(shù)字信號處理算法具有如下一些主要的特點(diǎn):
①信號處理算法運(yùn)算量大,要求速度快。不論是一維的語言信號,還是二維的圖像信號,一般算法的運(yùn)算量都很大,且算法的實(shí)現(xiàn)都必須實(shí)時(shí)。
②信號處理算法通常需要執(zhí)行大量的乘累加運(yùn)算。比如FIR濾波算法主要執(zhí)行的是一個(gè)點(diǎn)積運(yùn)算,也就是以乘、加為主的運(yùn)算。
③信號處理算法常具有某些特定模式。比較典型的數(shù)字濾波器中的連續(xù)推移位。
④信號處理算法大部分處理時(shí)間花在執(zhí)行相對小循環(huán)的操作上。
⑤信號處理要求專門的接口。一個(gè)非常重要的接口是把模擬信號與數(shù)字信號相互轉(zhuǎn)換的ADC和DAC,另外大量的數(shù)據(jù)交換需要有高速的數(shù)據(jù)吞吐能力。
從一開始,DSP的結(jié)構(gòu)就是針對DSP算法模型進(jìn)行構(gòu)造的,幾乎所有的DSP都包含有DSP算法的特征。因此,數(shù)字信號處理的上述特點(diǎn)要求DSP必須是專門設(shè)計(jì)的,典型DSP的設(shè)計(jì)滿足數(shù)字信號處理的這樣一些要求:
①單周期快速運(yùn)算,允許任意計(jì)算次序。
②單周期內(nèi)能取兩個(gè)以上操作數(shù),保證快速的乘累加運(yùn)算(MAC)。
③能產(chǎn)生信號處理算法需要的特殊尋址,如循環(huán)尋址和位翻轉(zhuǎn)尋址。
④有相應(yīng)的硬件循環(huán)緩沖區(qū),能執(zhí)行零開銷的循環(huán)和轉(zhuǎn)移操作。
⑤具有串口、DMA控制器、定時(shí)器等豐富的外設(shè)資源。
3DSP的基本結(jié)構(gòu)組成
3.1多總線結(jié)構(gòu)
微處理器內(nèi)一般有兩種基本總線結(jié)構(gòu):馮諾曼結(jié)構(gòu)和哈佛結(jié)構(gòu)。這兩種總線結(jié)構(gòu)的結(jié)構(gòu)框圖如圖1所示。馮諾曼結(jié)構(gòu)取指令、取數(shù)據(jù)都是通過同一總線完成。因此必須分時(shí)進(jìn)行,在高速運(yùn)算時(shí),往往在傳輸通道上出現(xiàn)瓶頸效應(yīng)。而DSP內(nèi)部采用的是哈佛結(jié)構(gòu),它在片內(nèi)至少有四套總線:程序的數(shù)據(jù)總線、程序的地址總線、數(shù)據(jù)的數(shù)據(jù)總線和數(shù)據(jù)的地址總線。這種分離的程序總線和數(shù)據(jù)總線,可允許同時(shí)獲取來自程序存儲器的指令字和來自數(shù)據(jù)存儲器的操作數(shù),互不干擾。有的DSP片內(nèi)還包括有其他總線,如DMA總線等,可在單周期內(nèi)完成更多的工作。
3.2流水線
與哈佛總線結(jié)構(gòu)相關(guān),DSP廣泛采用流水線以減少指令執(zhí)行時(shí)間,從而增加了處理器的處理能力。要執(zhí)行一條DSP指令,需要通過取指、譯碼、取操作數(shù)、執(zhí)行等幾個(gè)階段,DSP的流水線結(jié)構(gòu)是指它的這幾個(gè)階段在程序執(zhí)行過程中是重疊進(jìn)行的,即在對本條指令取指的同時(shí),前面的三條指令已依次完成譯碼、取操作數(shù)、執(zhí)行的操作。正是利用這種流水線機(jī)制,保證DSP的乘法、加法以及乘累加可以在單周期內(nèi)完成,這對提高DSP的運(yùn)算速度具有重要意義,特別是當(dāng)設(shè)計(jì)的算法需要連續(xù)的乘累加運(yùn)算時(shí)。
3.3硬件乘法器
專用的硬件乘法器是DSP的特征之一,硬件乘法器的功能是在單周期內(nèi)完成一次乘法運(yùn)算。DSP內(nèi)還增加了累加器寄存器來處理多個(gè)乘積的和,而且該寄存器通常比其他寄存器寬,這樣保證乘累加運(yùn)算結(jié)果不至于發(fā)生溢出。
3.4多處理單元
DSP內(nèi)部一般都包括多個(gè)處理單元,如ALU、乘法器、輔助算術(shù)單元等。它們都可在單獨(dú)的一個(gè)指令周期內(nèi)執(zhí)行完計(jì)算和操作任務(wù),而且往往同時(shí)完成。這種結(jié)構(gòu)特別適合于濾波器的設(shè)計(jì),如FIR和IIR。這種多處理單元結(jié)構(gòu)還表現(xiàn)為在將一些特殊的算法作成硬件,如典型的FFT的位翻轉(zhuǎn)尋址和流水FIR濾波算法的循環(huán)尋址等。而且大部分DSP具有零消耗循環(huán)控制的專門硬件,使得處理器不用花時(shí)間測試循環(huán)計(jì)數(shù)器的值就能執(zhí)行一組指令的循環(huán),硬件完成循環(huán)跳轉(zhuǎn)和循環(huán)計(jì)數(shù)器的衰減。
3.5外圍設(shè)備
DSP片內(nèi)通常具有DMA控制器、串行口、定時(shí)器等外設(shè),所以用戶通常只需要外加很少的器件就可以構(gòu)成自己的DSP系統(tǒng)。DMA控制器可以在不干擾CPU操作的前提下,由其專用的數(shù)據(jù)存取通道獨(dú)立完成接口到片內(nèi)存儲器之間的數(shù)據(jù)傳輸,從而形成片內(nèi)的高速數(shù)據(jù)通道。大多數(shù)DSP還支持IEEE1149.1標(biāo)準(zhǔn),用戶通過JTAG端口可對DSP進(jìn)行在線
實(shí)時(shí)仿真。
4當(dāng)前主流DSP的體系結(jié)構(gòu)
近年來,DSP不斷推陳出新,其硬件結(jié)構(gòu)也有了很大的改進(jìn)和提高。DSP體系結(jié)構(gòu)的革新在很大程度上受到應(yīng)用需求的影響,其指令集的設(shè)計(jì)是面向存儲器和數(shù)字信號處理算法來進(jìn)行性能優(yōu)化的。當(dāng)前高性能DSP結(jié)構(gòu)的主在特點(diǎn)就是采用了各種并行處理技術(shù),它可由兩個(gè)途徑實(shí)現(xiàn):一種途徑是基于VLIW、類RISC指令集等技術(shù)來增加單時(shí)鐘周期并發(fā)的指令數(shù);另一種途徑是通過SIMD、增大總線字長或增加指令字的長度等技術(shù)來增加單指令周期并行執(zhí)行的處理單元個(gè)數(shù)。
4.1VLIW結(jié)構(gòu)及其優(yōu)缺點(diǎn)
TI公司TMS320C6X系列DSP就是采用了VLIW的體系結(jié)構(gòu),其結(jié)構(gòu)如圖2所示。在VLIW處理器的硬件上,各功能單元共用大型寄存器堆,由功能單元同時(shí)執(zhí)行的各種操作是由VLIW的長指令來同步,它把長指令中不同字段的操作碼分送給不同的功能單元。相對于傳統(tǒng)型DSP,VLIW處理器使用簡單的指令集,一條指令只完成一個(gè)操作。這個(gè)處理器將簡單指令并行地發(fā)射出去,并同時(shí)執(zhí)行,有這樣的多條指令構(gòu)成一個(gè)超長指令字。由于使用了簡單指令集后,簡化了譯碼和執(zhí)行操作。
VLIW技術(shù)極大地提高DSP的性能,但它也有缺點(diǎn)。由于它的指令字長增加了,所以它較大地增加了程序存儲器的占用空間,使得DSP的成本隨之增加。同時(shí)為了支持多個(gè)并行指令的執(zhí)行,這種結(jié)構(gòu)的DSP要求有龐大的調(diào)整寄存器堆。
4.2SIMD結(jié)構(gòu)及其優(yōu)缺點(diǎn)
SIMD處理器把輸入的長數(shù)據(jù)分解為多個(gè)較短的數(shù)據(jù),然后由單指令并行地操作。它在目前一些高性能的DSP得到了應(yīng)用,如AD公司的ADSP21160系列DSP,如圖3所示。該結(jié)構(gòu)內(nèi)有兩套包括ALU、桶形移位器、乘法器和寄存器堆等功能部件的運(yùn)算單元,可在單周期內(nèi)對不同的操作數(shù)執(zhí)行兩個(gè)及以上的乘法操作。SIMD使總線、數(shù)據(jù)通道等資源充分
利用,并無需改變信號處理的基本結(jié)構(gòu)。但是,這種結(jié)構(gòu)只有處理并行算法時(shí)才是高效的。對于那種算法中的結(jié)果作為下一操作輸入的串行算法,SIMD處理器通常不使用。
5DSP結(jié)構(gòu)改進(jìn)的思考
過去的DSP結(jié)構(gòu)設(shè)計(jì)主要是面向計(jì)算密集型的應(yīng)用,而對控制密集型支持得不夠。而現(xiàn)實(shí)應(yīng)用中很多場合需要信號處理和精確控制的有效結(jié)合,如數(shù)字蜂窩電話,它要有監(jiān)控和語言音處理的工作?,F(xiàn)代的DSP將采用DSP/MCU的混合結(jié)構(gòu),在保證計(jì)算能力優(yōu)先的前提下,通過快速的現(xiàn)場切換、多執(zhí)行部件并行執(zhí)行等方式,加強(qiáng)控制類操作的處理能力。將MCU核集成到DSP核中,或者從整體上對DSP進(jìn)行重新設(shè)計(jì),使之兼有DSP和MCU的功能。
另外,為解決速度、功耗、可編程之間的矛盾,我們提出了一種新型的計(jì)算方式,它結(jié)合了現(xiàn)有微處理器和DSP的時(shí)間計(jì)算方式以及ASIC、FPGA解決方案的空間計(jì)算方式。這種可重構(gòu)DSP處理器的關(guān)鍵是它能同時(shí)進(jìn)行時(shí)間和空間計(jì)算。它由一個(gè)計(jì)算元件互相連接的二維陣列構(gòu)成,每個(gè)陣列都有各自的邏輯單元和本地寄存器。連接這些計(jì)算元件的可編程連線借以對陣列的數(shù)據(jù)流架構(gòu)動(dòng)態(tài)重構(gòu),從而可根據(jù)運(yùn)行的具體任務(wù)而對其進(jìn)行優(yōu)化。由于可重構(gòu)計(jì)算使開發(fā)人員可對其軟硬件加以控制,因此這些編譯器將在需要運(yùn)行的DSP的系統(tǒng)中實(shí)現(xiàn)真正的軟硬件協(xié)同設(shè)計(jì)。
評論