基于DSP的并行信號處理系統(tǒng)設(shè)計方案
自數(shù)字計算機問世以來,計算機的處理能力已經(jīng)增長了100 k倍以上。然而,現(xiàn)有性能最高的計算機的計算能力仍遠遠不能滿足人類對計算速度無止境的追求。
本文引用地址:http://cafeforensic.com/article/148248.htm在科學計算、地質(zhì)分析、氣象預測、仿真模擬、圖像處理以及實時信號處理領(lǐng)域,對計算機處理速度的要求尤為迫切。隨著半導體技術(shù)的迅速發(fā)展,采用超大規(guī)模集成電路設(shè)計的處理單元功能越來越強,然而單處理器性能的提高受到了諸多限制。因此,滿足對運算速度的巨大需求目前只能通過并行處理技術(shù)來實現(xiàn)。
1 概述
本文中設(shè)計了一種并行信號處理系統(tǒng),其主要特點是:
(1)具有強大的處理能力,可以完成多種信號處理模式。
(2)信號處理功能通過大量信號處理芯片(DSP)的并行計算完成。
?。?)信號處理功能的改變通過軟件實現(xiàn)。
圖1所示的是動目標檢測雷達信號處理機的主要組成部分,虛線中的處理模塊是本文要完成的工作。
2 幅相計算、CFAR檢測、M/N檢測
2.1 幅相計算
幅相計算指從復數(shù)據(jù)計算其幅度和相位,假使:
2.2 CFAR檢測和M/N檢測
雷達信號的檢測總是在干擾背景上進行的,為了在強干擾中提取信號,不僅要求有一定的信噪比,而且必須有恒虛警處理設(shè)備,恒虛警處理的目的是保持信號檢測時的虛警率恒定,這樣才能使處理機不致因虛警太多而過載。
?。?)單元平均恒虛警(CFAR)檢測器
已經(jīng)知道,在低分辨率的脈沖雷達中,海浪和雨雪等分布雜波可以看作很多獨立照射單元回波的迭加,因而雜波包絡(luò)的分布服從瑞利分布,如果檢測背景中存在此類雜波,檢測門限可以通過計算雜波的均值得到,但是由于雜波在空間分布的未知性,求雜波均值只能從被檢測目標鄰近單元來獲得,這就是比較常用的單元平均CFAR檢測器。為了減少這類檢測器在雜波邊緣內(nèi)側(cè)虛警顯著增大問題,一般采用其改進電路-兩側(cè)單元平均選大電路,如圖2所示。在被檢測單元的兩邊,為了防止目標本身對門限值的影響各空出了一個保護單元。
?。?)二維CFAR檢測器
當雷達工作于FFT方式時,CFAR檢測器的輸入數(shù)據(jù)包括距離和頻率2個變量,所以需要采用二維CFAR,如圖3所示。除0# 濾波器輸出送雜波圖處理外,其他多卜勒濾波器輸出各接一個單元平均CFAR檢測器。各CFAR檢測的結(jié)果合起來作為目標判斷。
?。?)M/N檢測
M/N檢測在CFAR檢測后進行,其中,N為積累脈沖數(shù),M為小于N的值。我們設(shè)定M/N檢測的準則為2/3,即相同距離門的信號在3個脈沖重復周期里至少2次過門限判定有目標。
2.3 雜波圖
雜波圖技術(shù)就是將雷達周圍的二維平面分成許多方位距離單元,把方位距離單元的接收信號存入一個存儲器中,每個存儲單元對應(yīng)一個方位距離單元,并且隨著天線的掃描,每個單元存儲的信號進行遞推更新:
其中:K是一個小于1的因子,xn和yn分別代表輸入、輸出。
所以天線多圈掃描以后,雜波圖中存貯的是相應(yīng)方位距離單元的雜波均值。檢測門限H根據(jù)式
?。?)計算,如果被檢測信號xn大于門限H,我們就判為有目標,否則就判無目標。
H=Cyn(5)
其中:C為一個門限乘子,C的大小決定著檢測概率的虛警概率。
3 系統(tǒng)的設(shè)計
并行處理的目的是通過采用多個處理單元同時對任務(wù)處理來減少任務(wù)的執(zhí)行時間,如何能以最短的時間完成任務(wù)成為并行處理機設(shè)計者最關(guān)心的問題,對這一問題的反映表現(xiàn)在處理機的2個基本性能指標:加速比和并行效率。而并行處理機的這2個基本性能決定于組成并行處理機的3個要素:處理單元、并行處理機網(wǎng)絡(luò)結(jié)構(gòu)、并行算法程序和任務(wù)分配方法。三者之間緊密聯(lián)系,互相依賴。
3.1 處理單元的選擇
處理單元的性能可以說是決定處理機性能最基本的因素,高性能的處理單元可以提高系統(tǒng)性能、減少系統(tǒng)體積和功耗、降低結(jié)構(gòu)復雜性和提高軟件可維護性。處理單元按應(yīng)用范圍大致可分為中央處理單元、專用ASIC芯片、FPGA/EPLD、數(shù)字信號處理器。在實時數(shù)字信號處理應(yīng)用上,DSP仍具備明顯優(yōu)勢。
在并行處理中,更強調(diào)DSP是否具有適于構(gòu)成并行處理機的特殊功能,如高速通信口的通信能力、共享存貯器的接口功能等。TMS320C40和ADSP21060在結(jié)構(gòu)功能上有很多相似之處,相比較而言,綜合性能較好地并行DSP是ADSP21060,他的運算速度、數(shù)據(jù)吞吐能力、片內(nèi)存貯器容量都遠優(yōu)于TMS320C40,相對于其他類型DSP.他的突出特點是:FFT速度快、片內(nèi)存貯器容量大,很好地共享存貯器接口。各種兼容型號ADSP2106X的選擇余地也較大,他還與最新推出的ADSP21160代碼兼容,結(jié)構(gòu)與接口形式也類似。
3.2 并行處理機互聯(lián)結(jié)構(gòu)
并行處理機互聯(lián)網(wǎng)絡(luò)的主要功能是為各處理單元提供數(shù)據(jù)交換的通路并負責子任務(wù)傳送和控制調(diào)度信號的傳遞。處理單元之間的網(wǎng)絡(luò)結(jié)構(gòu)大致可分成2類:
?。?)共享總線(共享存貯器)系統(tǒng),稱為緊耦合式并行系統(tǒng)。
?。?)處理單元有各自獨立的數(shù)據(jù)存貯器而通過通信口相連的分布式并行系統(tǒng),又稱松耦合式系統(tǒng)。緊耦合式的共享總線系統(tǒng)在處理單元個數(shù)較少的情況下,以其無需數(shù)據(jù)通信而能獲得較高的加速比。當處理單元個數(shù)很多時,共享總線將造成頻繁的總線沖突和等待,而且共享總線結(jié)構(gòu)的可擴充性和靈活性不及分布式系統(tǒng),不適于大規(guī)模并行處理系統(tǒng),可重構(gòu)能力和容錯能力都遠不如分布式系統(tǒng)。
通用并行DSP的通信口速度在30~60 MHz,這為在處理單元數(shù)目很多的大規(guī)模并行處理采用分布式系統(tǒng)設(shè)計創(chuàng)造了條件。TMS320C40或ADSP21060提供的多達6個高速通信口的總通信能力與其指令速度或平均運算能力相當,而同時TMS320C40或ADSP21060都提供了共享數(shù)據(jù)總線的接口,TMS320C40有2套獨立的總線,其中一套可以用于和其他TMS320C40共享數(shù)據(jù),而ADSP21060的片內(nèi)具有共享總線仲裁邏輯,可以在無需添加外部控制電路的情況下,將不多于6個ADSP21060直接相連。
以上分析表明,分布式并行系統(tǒng)更適合于大規(guī)模并行系統(tǒng),而共享總線式系統(tǒng)在小規(guī)模的并行處理機上可以得到較高的性能。以ADSP21060為例,當處理單元小于5時共享總線系統(tǒng)的效率較高;反之,分布式并行系統(tǒng)將更好。
3.3 并行算法、任務(wù)分配和軟件編程
并行算法的好壞主要以其并行度高低來衡量,并行算法和并行程序的設(shè)計復雜度遠大于傳統(tǒng)的串行算法和串行程序設(shè)計,他更多地依賴于處理機結(jié)構(gòu),現(xiàn)有的并行算法遠不能滿足并行處理的需要,而且目前還缺乏一種有效的并行開發(fā)系統(tǒng)和并行設(shè)計語言,但對于雷達信號處理這一領(lǐng)域來說,信號處理任務(wù)的類型基本上是確定的,這就縮小了設(shè)計者的設(shè)計范圍,從而大大減少了程序設(shè)計的難度。
采用上文所述的并行DSP作為處理單元構(gòu)成的信號處理機將是完全可編程和軟件可重載的,根據(jù)需要可以對不同并行子模塊重新進行功能定義。算法軟件以標準模塊存放在DSP的RAM或ROM中,當處理單元的功能改變時,可調(diào)用相應(yīng)的軟件模塊。
任務(wù)分配和調(diào)度仍是并行處理系統(tǒng)設(shè)計的一個難題,至今尚無實用的任務(wù)自動分配方法,而任務(wù)分配所帶來的成本又太高。根據(jù)雷達信號處理固有的特點,可以將其定義成帶有輸入?yún)?shù)的軟件模塊,每個模塊隨著其輸入?yún)?shù)的不同,其輸出參數(shù)如運算時間、數(shù)據(jù)通信時間、數(shù)據(jù)通信路徑都將不同。
采用數(shù)據(jù)流全驅(qū)動的方式是將處理過程中的全部數(shù)據(jù)分割成一定大小的數(shù)據(jù)包,在每個數(shù)據(jù)包中,除了實際數(shù)據(jù)還包括有如下信息:數(shù)據(jù)包長度、處理方式、數(shù)據(jù)描述、校驗碼。處理方式中含有足夠的處理信息,用于指示DSP或子模塊如何處理此包數(shù)據(jù),即選擇多普勒濾波、MTI、CFAR等。數(shù)據(jù)描述信息詳細地給出了此包數(shù)據(jù)的特點,包括距離門起止號、多普勒號、通道號等。DSP接收到一個數(shù)據(jù)包后,如果此包數(shù)據(jù)的處理相對于其他數(shù)據(jù)包是獨立的,他就立即進行處理,否則等待其他包數(shù)據(jù)到齊或者向其他DSP轉(zhuǎn)發(fā)。
評論