基于PCI總線的嵌入式實時圖像處理系統(tǒng)
1 圖像處理系統(tǒng)發(fā)展現(xiàn)狀
在計算機信息處理及應(yīng)用中,圖像信息處理以及處理結(jié)果的應(yīng)用占有十分重要的地位。圖像處理的發(fā)展依賴于處理器芯片(包括單片機、DSP等)技術(shù)的應(yīng)用和發(fā)展,以及大容量、價格低廉的存儲器的出現(xiàn)。圖像處理系統(tǒng)雖然由機箱式大體積結(jié)構(gòu)發(fā)展為插卡式小型化結(jié)構(gòu),但是由于圖像處理存在大量的數(shù)據(jù)信息,在實時性和容量上一般不能滿足多數(shù)需要實時處理的場合。這主要體現(xiàn)在如下2個方面。
1.1 實時性要求
圖像處理系統(tǒng)有很多種實現(xiàn)方法,比如在通用計算機上用軟件實現(xiàn)、用單片機實現(xiàn)、利用特殊用途的DSP芯片來實現(xiàn)等。但這些實現(xiàn)方法都有著缺點,例如軟件實現(xiàn)速度太慢,不能用于實時系統(tǒng);單片機采用的是馮·諾依曼總線結(jié)構(gòu),而且乘法運算速度太慢;如果用特殊用途的DSP芯片又缺乏靈活性,而且開發(fā)工具不是很完善。
在本系統(tǒng)中,圖像處理系統(tǒng)是在通用計算機上加入DSP加速卡來實現(xiàn)。利用DSP芯片的高速處理特性完成大部分的圖像處理工作,計算機只是作為輔助操作和存儲系統(tǒng)。這種方法發(fā)揮了DSP的高速性能又具有相當大的靈活性的特點,開發(fā)工具比較完善。
實現(xiàn)實時性要求還必須有足夠的傳輸速度,PCI總線速度最高可達132MB/s,這是其他總線無法比擬的速度,如ISA總線速度只有5MB/s。
1.2 小型化要求
現(xiàn)今圖像處理應(yīng)用越來越趨于小型化系統(tǒng),趨向于把整個處理系統(tǒng)集成在一個小"黑盒子"里面,甚至于一塊電路板上。這就要求圖像處理系統(tǒng)具有高速度、高集成度的處理芯片來完成原本需要許多部件合作完成的任務(wù)。DSP的中央處理器特性使得可以把眾多的功能集于一身,并通過外部擴展來實現(xiàn)復雜的功能,實現(xiàn)系統(tǒng)的小型化。
另外,視頻數(shù)據(jù)一個很大的特點就是大容量性,這是與音頻數(shù)據(jù)最大的區(qū)別之一。對于大容量數(shù)據(jù)的實時處理不但需要高速的CPU,還需要能擴展的大容量存儲空間。在通用計算機上用軟件實現(xiàn)時,其存儲空間由計算機的存儲空間決定,其擴展性能受到了限制;同時單片機的擴展空間有限。它們都無法滿足視頻數(shù)據(jù)的大容量要求。
本文正是著眼于實時性和小型化要求這兩方面問題,設(shè)計了用DSP加速卡實現(xiàn)的圖像采集系統(tǒng)。利用DSP芯片的高速處理特性完成大部分的圖像處理工作,上位機只完成輔助操作和存儲系統(tǒng)。這種方法發(fā)揮了DSP的高速性能又具有相當大的靈活性,而且開發(fā)工具比較完善。另外,PCI總線速度最高可達528MB/s(66MHz、64位),這是其他總線無法比擬的速度。系統(tǒng)中C6000系列中DSP的可擴展存儲空間高達1GB,這完全可以滿足一般圖像處理系統(tǒng)的需要。
2 DSP圖像處理系統(tǒng)結(jié)構(gòu)
本系統(tǒng)采用TI公司C6000系列DSP中的TMS320C6211作為系統(tǒng)的CPU。圖像數(shù)據(jù)通過視頻頭輸入模擬圖像信號,這些信號經(jīng)過視頻解碼芯片進行A/D轉(zhuǎn)換為數(shù)字信號,經(jīng)FIFO輸入DSP進行圖像的增強、分割、特征提取和數(shù)據(jù)壓縮等,然后輸出信號經(jīng)PCI解碼芯片轉(zhuǎn)換為符合PCI總線規(guī)范的標準信號,通過PCI總線接口傳到上位機。
本系統(tǒng)設(shè)計目的是用于智能樓宇的管理,主要實現(xiàn)對樓宇一些重要參數(shù)的實時檢測功能等。當然可以用于其他的監(jiān)控系統(tǒng),其硬件系統(tǒng)基本一致,不同的在于軟件功能的區(qū)別。系統(tǒng)結(jié)構(gòu)圖如圖1。 從圖1可以看出,整個系統(tǒng)可分為3個模塊: DSP圖像處理模塊,視頻解碼模塊,PCI總線模塊。下面分別介紹這3個模塊的實現(xiàn)過程和功能。
2.1 DSP圖像處理模塊
本系統(tǒng)選用TI公司的C6000系列DSP之中的TMS320C611作為本系統(tǒng)的CPU。C6000是TI公司發(fā)布的面向視頻處理領(lǐng)域的新款高速數(shù)字處理芯片,適用于移動通信基站、圖像監(jiān)控、雷達系統(tǒng)等需要高速度和高度智能化的應(yīng)用領(lǐng)域。存儲空間選用現(xiàn)代公司的2片HY57V651620B作為運行過程中的存儲器(SDRAM)和AMD公司的AM29LV800B 作為啟動時候需加載程序和參數(shù)的存儲器(FLASH)。其結(jié)構(gòu)如圖2所示。圖中的HPI(Host Port Interface)為主機口;EMIF(External Memory Interface)為外部存儲器接口,兼容同步/異步方式。 (1) TMS320C6211處理器特性及完成功能
TMS320C6211處理器由3個主要部分組成:CPU內(nèi)核、外設(shè)和存儲器。它的高速性能主要體現(xiàn)在如下幾個方面:① TMS320C6211的存儲空間最大擴展可以達到512MB,這完全可以滿足各種圖像處理系統(tǒng)所需的內(nèi)存空間,而且其最高時鐘可達167MHz,峰值性能可達1600MIPS(百萬條指令/秒)、2400MOPS(百萬次操作/秒)。② 并行處理結(jié)構(gòu)。TMS320C6211芯片內(nèi)有8個并行處理單元,分為相同的兩組,并行結(jié)構(gòu)突破傳統(tǒng)設(shè)計使得芯片具有很高的性能。③ 芯片體系采用VelociTI結(jié)構(gòu)。VelociTI是一種高性能的甚長指令字(VLIW)結(jié)構(gòu),單指令字字長為32bit,8個指令組成一個指令包,總字長為256bit,即每秒鐘可以執(zhí)行8條指令,同時芯片內(nèi)部設(shè)置了專門的指令分配模塊,可以將每個256bits的指令包同時分配到8個處理單元,并由8個單元同時執(zhí)行。④ 采用流水線操作實現(xiàn)高速度、高效率。TMS320C6211只有在流水線充分發(fā)揮作用的情況下,才能達到最高的MIPS。C6211的流水線分為3個階段:指令讀入、解碼和執(zhí)行,總共11級。
評論