圖像采集壓縮SOC系統(tǒng)在FPGA中的實(shí)現(xiàn)
圖像采集和處理已經(jīng)成為了現(xiàn)代工業(yè)控制中必不可少的環(huán)節(jié)。傳統(tǒng)的方法一般采用的是圖像采集卡加工控機(jī)來實(shí)現(xiàn)整個(gè)系統(tǒng)。但隨著嵌入式技術(shù)的發(fā)展,芯片的性能大大增強(qiáng),嵌入式系統(tǒng)在工業(yè)控制系統(tǒng)中普及。作為前端的圖像采集系統(tǒng)此時(shí)就不適宜再以圖像采集卡的形式出現(xiàn),而應(yīng)當(dāng)以更加簡(jiǎn)捷,方便的接口與主系統(tǒng)相連。
本設(shè)計(jì)使用Alera的FPGA實(shí)現(xiàn)了整個(gè)圖像采集系統(tǒng)。整個(gè)系統(tǒng)完成了圖像的采集、壓縮和傳輸。系統(tǒng)采用流行的工業(yè)總線CAN做為其傳輸總線,不僅接口簡(jiǎn)易,成本低,而且可靠性較高。
系統(tǒng)描述
本設(shè)計(jì)中圖像采集系統(tǒng)預(yù)期的目標(biāo)是每秒采集2~3幅30萬像素(640480)的圖像,壓縮后通過CAN總線進(jìn)行傳輸。按照1:8的壓縮比計(jì)算,壓縮后每幀數(shù)據(jù)量大約為0.3Mb,CAN總線峰值傳輸速度是1Mb/s,因此這樣的一個(gè)總體的設(shè)計(jì)方案是可行的。
根據(jù)系統(tǒng)所實(shí)現(xiàn)的功能,決定整個(gè)系統(tǒng)要包括六大模塊,分別是圖像采集及存儲(chǔ)接口、I2C主控制模塊(對(duì)SAA7113H進(jìn)行配置)、JPEG編碼器、CAN總線控制器、Wishbone總線和中央控制模塊。圖1為系統(tǒng)的結(jié)構(gòu)框圖。
圖1 系統(tǒng)結(jié)構(gòu)框圖
攝像頭產(chǎn)生的原始模擬圖像數(shù)據(jù)流首先通過SAA7113H轉(zhuǎn)換為數(shù)字信號(hào),并攜帶有一定的同步及控制信息,傳入FPGA內(nèi)部異步FIFO內(nèi)。圖像采集及存儲(chǔ)接口從異步FIFO讀取數(shù)據(jù)并分析,提取所需要的保存至外部SRAM中,當(dāng)存滿一幀數(shù)據(jù)時(shí),便可以進(jìn)行壓縮了。當(dāng)JPEG編碼模塊壓縮好數(shù)據(jù)后,便等待CAN總線進(jìn)行傳輸,最后直至整幀數(shù)據(jù)處理完畢。
整個(gè)系統(tǒng)的實(shí)現(xiàn)大約是60~100萬門左右,因此可以采用Altera CycloneII系列中器件的EP2C20,它擁有2萬個(gè)LE,24萬左右的存儲(chǔ)單元和52個(gè)乘加單元。系統(tǒng)Fitter之后的結(jié)果如表1所示,占用了芯片63%的邏輯資源和12%存儲(chǔ)資源。在這其中,JPEG編碼模塊以及JPEG模塊與Wishbone總線的接口占用了絕大多數(shù)部分資源??梢钥闯觯褂肊P2C20實(shí)現(xiàn)本文所描述的系統(tǒng)還是非常富余的。
圖2 PCB調(diào)試樣板
圖2為最后制成的樣板,這塊樣板上還包括了一些便于調(diào)試和其他研發(fā)目的的額外部件,真正產(chǎn)品的PCB板將會(huì)更加小巧。
視頻信號(hào)采集及存儲(chǔ)接口
本設(shè)計(jì)采用Phillips的SAA7113H芯片做模擬視頻信號(hào)的采集。它的功能非常強(qiáng)大,最多可同時(shí)采集4路CVBS格式的視頻數(shù)據(jù)。它通過VPO口輸出數(shù)據(jù),并支持多種視頻格式輸出,同時(shí)在輸出數(shù)據(jù)流中包含同步信息和場(chǎng)信息,接口比較簡(jiǎn)單。
VPO的數(shù)據(jù)輸出與27M時(shí)鐘同步的,這與JPEG encoder采用30M內(nèi)部系統(tǒng)時(shí)鐘處于兩個(gè)時(shí)鐘域。因此,使用異步FIFO進(jìn)行跨時(shí)鐘域的數(shù)據(jù)傳遞。
數(shù)據(jù)采集以后便是對(duì)其進(jìn)行識(shí)別和存儲(chǔ)。從SAA7113H傳出數(shù)據(jù)的最小單位是一個(gè)掃描行,以0xFF 0x00 0x00為標(biāo)識(shí),并且在行首尾分別有SAV(start of active video)和EAV(end of active video)字段。SAV和EAV中含有該掃描行是否是有效行,屬于第幾場(chǎng)這樣的信息。JPEG編碼器需要的數(shù)據(jù)是一整幅圖像,即一個(gè)場(chǎng)對(duì)。因此對(duì)采集的圖像,需要使用幀解碼(Frame Decoder)子模塊處理原始數(shù)據(jù)流中的同步信息,垂直掃描消隱信號(hào)。
本設(shè)計(jì)的存儲(chǔ)器件使用了一塊4Mb的SRAM,正好可以保存一副未經(jīng)壓縮的30萬像素的圖片。對(duì)SRAM存儲(chǔ)和讀取地址的產(chǎn)生應(yīng)該完全采用不同的方式,在本設(shè)計(jì)中分別采用兩個(gè)子模塊分別負(fù)責(zé)這兩項(xiàng)功能。Frame Decoder輸出的數(shù)據(jù)在存入SRAM時(shí)是按照行的順序逐個(gè)存入,而JPEG encoder在讀取的時(shí)候則應(yīng)該是按照對(duì)像素處理順序――以88塊的方式讀出。整個(gè)讀寫由控制狀態(tài)機(jī)(Read Write Control)來進(jìn)行統(tǒng)一控制。視頻采集及存儲(chǔ)接口的結(jié)構(gòu)圖如圖3所示。
圖3 視頻采集及存儲(chǔ)接口模塊
JPEG壓縮模塊
JPEG壓縮標(biāo)準(zhǔn)從1993年提出至今已有14年了,從各個(gè)方面來看都已經(jīng)非常成熟,并且被廣泛的使用于各個(gè)領(lǐng)域,這也正是本設(shè)計(jì)采用JPEG壓縮模式的原因之一。JPEG壓縮的過程包括了88 DCT(離散余弦變換)、Zig-Zag掃描、量化、游程編碼和熵編碼(使用Huffman編碼)五個(gè)主要的過程。本設(shè)計(jì)中的JPEG壓縮模塊除了包括這五大部分之外還要有字節(jié)分包處理、字節(jié)碼處理(主要是插入一些特殊的碼字)、FIFO、wishbone總線接口和配置寄存器等一些功能模塊來協(xié)調(diào)整個(gè)系統(tǒng)的運(yùn)作。該模塊的結(jié)構(gòu)如圖4所示。
圖4 JPEG壓縮模塊結(jié)構(gòu)圖
Huffman編碼出來的數(shù)據(jù)是變長(zhǎng)碼,它包括了兩部分,即碼字本身和碼字長(zhǎng)度。在Byte Pack模塊中,根據(jù)碼字的長(zhǎng)度對(duì)碼字進(jìn)行適當(dāng)?shù)囊莆唬缓笳沓?位長(zhǎng)度,送入Byte Code Insetion模塊。該模塊根據(jù)碼字的實(shí)際值進(jìn)行判斷,如果當(dāng)前碼字的值是FF,便在其后插入0x00,如果當(dāng)前碼字是本幀最后一個(gè)碼字的話,便在其后插入0xFFD9(0xFFD9是JPEG圖像標(biāo)準(zhǔn)中的結(jié)束標(biāo)志)以標(biāo)示該幀的完結(jié)。這樣在接收端中就可以用0xFFD9對(duì)數(shù)據(jù)流中每一幀壓縮的數(shù)據(jù)進(jìn)行分割。最后處理好的字節(jié)流將送入FIFO中,以等待CAN總線空閑。
另外,還有Control Regs模塊,可以使用總控制器通過Wishbone Bus對(duì)其中的功能寄存器進(jìn)行修改,進(jìn)而操控整個(gè)JPEG編碼的過程。這個(gè)操作必不可少,只有使JPEG編碼具有可控性,才能協(xié)調(diào)采集、壓縮、傳輸?shù)拳h(huán)節(jié)的順利進(jìn)行。
系統(tǒng)控制模塊
本系統(tǒng)的大部分功能都采用硬件進(jìn)行實(shí)現(xiàn),因此,軟件的控制流程就變的非常簡(jiǎn)單,僅僅包括了對(duì)各個(gè)模塊進(jìn)行初始化配置和控制協(xié)調(diào)各個(gè)模塊。本設(shè)計(jì)中的控制模塊采用了微碼狀態(tài)機(jī)替代了微處理器核,不僅可以節(jié)約邏輯成本(包括微碼在內(nèi),僅有216個(gè)LE),還提高了運(yùn)行效率。微碼狀態(tài)機(jī)的實(shí)現(xiàn)是根據(jù)系統(tǒng)的具體要求,對(duì)處理器的體系結(jié)構(gòu)進(jìn)行簡(jiǎn)化,本設(shè)計(jì)所實(shí)現(xiàn)的微碼狀態(tài)機(jī)在功能上相當(dāng)于一個(gè)只有mov和jump指令的處理器。另外,微碼的使用本身就增加了該模塊的靈活性,想修改整個(gè)系統(tǒng)配置或者工作的過程的話并不需要修改模塊的代碼,而只是修改微碼便可以,大大增加了可重用性。整個(gè)系統(tǒng)的控制流程如圖5所示。
圖5 系統(tǒng)工作流程
本設(shè)計(jì)的系統(tǒng)圖像采集壓縮速度都要大于CAN總線的傳輸速度,因此只有第一次向CAN總線發(fā)送數(shù)據(jù)時(shí)需要判斷壓縮的數(shù)據(jù)是否已經(jīng)達(dá)到8字節(jié),以后每次當(dāng)CAN傳輸完上一次壓縮數(shù)據(jù)時(shí),JPEG encoder已經(jīng)又一次壓縮好8字節(jié)數(shù)據(jù),等待傳輸了,因此就不必每次都進(jìn)行判斷。
Wishbone總線與開源IP
系統(tǒng)中各模塊的互連采用的是比較簡(jiǎn)單的Wishbone總線。Wishbone總線標(biāo)準(zhǔn)是開放式總線,沒有任何專利費(fèi)用,它現(xiàn)在由opencore維護(hù),并且在opencore的網(wǎng)站上有很多由專人維護(hù)并且與Wishbone兼容的開源IP。本設(shè)計(jì)中的I2C master和CAN controller就是從opencore上免費(fèi)獲得的開源IP。合理的使用這些軟核,并將其集成于自己的系統(tǒng)中將大大加快整個(gè)設(shè)計(jì)的進(jìn)程和產(chǎn)品的成本。
在系統(tǒng)中存在1個(gè)主設(shè)備(master)和3個(gè)從設(shè)備(slave),為每個(gè)slave分配好固定的地址,因此Wishbone總線模塊所做的事情僅僅是進(jìn)行地址譯碼。
系統(tǒng)驗(yàn)證與仿真
雖然本設(shè)計(jì)所構(gòu)建的SOC系統(tǒng)是基于FPGA的,但是在上板調(diào)試前首先在PC上建立整個(gè)系統(tǒng)的仿真環(huán)境,對(duì)系統(tǒng)進(jìn)行充分的驗(yàn)證,這樣可大大的加速整個(gè)項(xiàng)目的進(jìn)度。本設(shè)計(jì)中為系統(tǒng)建立的仿真環(huán)境如圖6所示。
圖6 驗(yàn)證環(huán)境
準(zhǔn)備原始數(shù)據(jù)做為系統(tǒng)圖像源的輸入,并且使用Can Receiver采集系統(tǒng)的輸出,最后和軟件模型生成的JPEG壓縮數(shù)據(jù)進(jìn)行比對(duì),對(duì)錯(cuò)誤進(jìn)行定位,另外也可在系統(tǒng)中設(shè)置監(jiān)控點(diǎn),輸出數(shù)據(jù)流,這樣便可知道具體在哪一個(gè)環(huán)節(jié)中出現(xiàn)了錯(cuò)誤。圖7為運(yùn)行testbench產(chǎn)生的接收數(shù)據(jù)波形文件。
圖7 數(shù)據(jù)波形
總結(jié)
在本設(shè)計(jì)中,筆者使用FPGA構(gòu)建了一個(gè)SOC系統(tǒng),完成了圖像的采集、壓縮和傳輸功能,很多地方還可以進(jìn)一步的優(yōu)化。本設(shè)計(jì)的重點(diǎn)在于在FPGA上應(yīng)用了SOC的設(shè)計(jì)方法,并實(shí)現(xiàn)了一個(gè)比較簡(jiǎn)單的SOC系統(tǒng)。這樣做繞過了ASIC設(shè)計(jì)的高復(fù)雜性,高風(fēng)險(xiǎn)性和高投入,從而實(shí)現(xiàn)了簡(jiǎn)化最終PCB系統(tǒng),降低硬件成本的目的,并且對(duì)系統(tǒng)的實(shí)現(xiàn)更加靈活,能按照客戶的愿望定制,修改系統(tǒng)的功能。另外在整個(gè)設(shè)計(jì)過程中,盡量的應(yīng)用可重用的IP軟核,最大限度的加快了開發(fā)進(jìn)度和降低了開發(fā)費(fèi)用和成本。
現(xiàn)在,F(xiàn)PGA廠商已推出65nm最新工藝的器件,使集成度進(jìn)一步提高,而功耗和成本又大幅度降低。在這樣的環(huán)境下,相信在不久的將來FPGA會(huì)不僅僅只作為協(xié)處理器的配角出現(xiàn),而是更多的出現(xiàn)以FPGA實(shí)現(xiàn)的SOC系統(tǒng)。
評(píng)論