基于FPGA和LCOS技術(shù)的3D視頻前端處理與顯示系統(tǒng)設(shè)計(jì)
1 顏色分量的獲取與亮度的增強(qiáng)
傳統(tǒng)的方法只采用紅加藍(lán)、紅加綠色度分量合成3D視頻,這樣會(huì)使畫面的損傷較大,丟失33%以上的顏色分量,觀看起來(lái)顏色失真較大,亮度也大大降低,增加了眼睛的負(fù)擔(dān),易產(chǎn)生疲勞。針對(duì)顏色失真本文采用紅加青的方法以減少色度的丟失,這樣可使畫面色度飽和度還原到原始畫面的90%以上。
針對(duì)亮度降低提出了基于亮度的圖像增強(qiáng)方法。傳統(tǒng)的基于Retinex理論的演變法存在一定的不足,如將RGB空間轉(zhuǎn)換到HSI空間需要大量的三角函數(shù)運(yùn)算,并采用傅里葉變換處理Retinex理論部分的高斯函數(shù),大大影響處理速度。本文提出了基于YCbCr顏色空間的亮度分量處理法,同時(shí)采用無(wú)限脈沖響應(yīng)數(shù)字濾波器(IIR)實(shí)現(xiàn)高斯函數(shù)運(yùn)算。實(shí)驗(yàn)證明,該算法不但能增強(qiáng)圖像的質(zhì)量,還能有效避免Retinex算法中帶來(lái)的光環(huán)效應(yīng),同時(shí)大大加快算法處理速度。基于亮度Y分量的Retinex 處理過(guò)程可表示為:
式中Y( x , y)為亮度分量函數(shù),F(xiàn)( x , y) 被稱為環(huán)境函數(shù),一般用高斯函數(shù)表達(dá)式為:
σ為高斯函數(shù)的標(biāo)準(zhǔn)偏差,k 表示環(huán)境函數(shù)的個(gè)數(shù)。環(huán)境函數(shù)Fk用于選取不同的標(biāo)準(zhǔn)偏差σk,Wk用來(lái)控制環(huán)境函數(shù)范圍的尺度,它表示與Fk相關(guān)的權(quán)重系數(shù)。
Retinex 處理算法的主要步驟就是高斯濾波,其運(yùn)算速度直接決定了算法運(yùn)行效率。為避免傅立葉變換的復(fù)雜的運(yùn)算和不足,對(duì)高斯濾波器進(jìn)行了IIR實(shí)現(xiàn),把高斯濾波器分解為正向?yàn)V波器和反向?yàn)V波器的組合,如下面的差分方程。
正向?yàn)V波器:
其中,C、di’是濾波器系數(shù),I [n]是輸入數(shù)據(jù),w1 [n]和w2 [n] 分別是正向和反向?yàn)V波器的中間狀態(tài),O1[n]、O2 [n]為其處理結(jié)果。正向和反向?yàn)V波器就構(gòu)成了高斯濾波器的IIR實(shí)現(xiàn)過(guò)程。可以利用高斯函數(shù)的可分離性:
對(duì)圖像先逐行后逐列進(jìn)行處理,最終就可以實(shí)現(xiàn)二維高斯數(shù)字濾波。下圖2為原圖、傳統(tǒng)Retinex算法、基于Y分量Retinex算法處理后的對(duì)比圖。圖中可以看出,傳統(tǒng)算法可以增強(qiáng)圖像亮度,但灰度化也很明顯。而本文采用的方法不僅可以增強(qiáng)亮度,也可以保持原有圖像的整體鮮艷效果。
另外,傳統(tǒng)的3D眼鏡僅采用紅色或藍(lán)色塑料或玻璃鏡片作為濾光片,使濾光效果大打折扣,觀眾佩戴觀看影片時(shí),會(huì)出現(xiàn)不同程度的重影現(xiàn)象,影響觀看效果。為此本文采用反射率和透過(guò)率都達(dá)到90%以上的反青透紅和反紅透青的濾光片作為3D眼鏡的鏡片,這樣可以使紅色鏡片僅通過(guò)紅色畫面,青色鏡片透過(guò)藍(lán)、綠色畫面,消除了重影現(xiàn)象,使觀看效果更加鮮活、逼真,下圖3為濾光片及制作的紅藍(lán)3D眼鏡。
2 視頻處理系統(tǒng)基本結(jié)構(gòu)與簡(jiǎn)化
整個(gè)視頻處理系統(tǒng)結(jié)構(gòu)如圖4所示。兩路攝像頭將采集到的信號(hào)送入TW2867進(jìn)行A/D轉(zhuǎn)換,輸出的復(fù)用信號(hào)送入解復(fù)用(demux)模塊,分離出的兩路復(fù)合視頻數(shù)據(jù)分別送入BT656數(shù)據(jù)解碼模塊、幀緩存控制模塊、像素分辨率縮放模塊、YCbCr 4:2:2轉(zhuǎn)YCbCr 4:4:4數(shù)據(jù)模塊、YCbCr亮度增強(qiáng)模塊、YCbCr 4:4:4轉(zhuǎn)RGB數(shù)據(jù)模塊,最后將RGB數(shù)據(jù)送入LCOS時(shí)序控制模塊,以鎂光公司的CS-FLCOS作為微顯示器件,搭建光機(jī)系統(tǒng),顯示出3D視頻畫面。對(duì)其中的TW2867芯片和LCOS芯片分別要進(jìn)行I2C總線配置和SPI總線配置其內(nèi)部的相關(guān)寄存器參數(shù)。
(1)TW2867解碼
采用帶有LED夜視功能的Sony CCD 感光芯片攝像頭,視頻輸出分辨率為720*576,為標(biāo)準(zhǔn)的PAL制式視頻格式。選用Techwell公司的TW2867 A/D轉(zhuǎn)換芯片,能自動(dòng)識(shí)別PAL/NTSC/SECAM格式的2路復(fù)合視頻信號(hào),通過(guò)I2C總線的配置,TW2867將兩路攝像頭信號(hào)轉(zhuǎn)換為符合BT656標(biāo)準(zhǔn)的8位YCbCr數(shù)字信號(hào)。TW2867每一路都含有10位的ADC轉(zhuǎn)換器、高質(zhì)量的鉗位和增益控制器和梳狀濾波器,以濾除信號(hào)中的噪聲,同時(shí)采用了一些圖像增強(qiáng)技術(shù),以獲得高質(zhì)量的YCbCr數(shù)字信號(hào)。
(2)BT656數(shù)據(jù)解碼模塊
國(guó)際電信聯(lián)盟無(wú)線電通信組(ITU-CCIR)發(fā)布了ITU-BT656的視頻標(biāo)準(zhǔn),其行數(shù)據(jù)結(jié)構(gòu)如圖5所示。該模塊首先需要檢測(cè)數(shù)據(jù)流中是否按序出現(xiàn)了FF、00、00的幀頭SAV或幀尾EAV信息。如果出現(xiàn)則對(duì)后8位的XY值進(jìn)行判斷,判斷是否出現(xiàn)SAV、EAV信號(hào),將有效視頻信號(hào)的以亮度分量(Y)作為高8位,以色度分量(Cb或Cr)作為低8位合成16位的YCbCr數(shù)據(jù),將BT656數(shù)據(jù)奇偶場(chǎng)的數(shù)據(jù)合并為一幀寫入幀緩存中。
幀緩存中裝載的是兩場(chǎng)視頻數(shù)據(jù),在讀取的時(shí)候采用FIFO緩存并采用雙線性插值算法,將原來(lái)720*576的像素分辨率放大到852*480。雙線性插值算法將在水平和垂直兩個(gè)方向分別進(jìn)行一次線性插值。其定量計(jì)算方法如下:空間坐標(biāo)系下四個(gè)點(diǎn):A(x,y+1)、B(x,y)、C(x+1,y)、D(x+1,y+1),如圖6所示,其灰度值依次為Ga、Gb、Gc、Gd,dx和dy分別表示目標(biāo)點(diǎn)與點(diǎn)B在水平和垂直兩個(gè)方向上的增量,其灰度值Gt可以由其余四點(diǎn)量化表示,如式2-1。
Gt = (1 - dx)(1 - dy)Gb + dx(1 - dy)Gc + (1 - dx)dyGa + dxdyGd (2-1)
從電路實(shí)現(xiàn)方面而言,公式(2-1)共需要8個(gè)乘法器、2 個(gè)減法器和4 個(gè)加法器,將會(huì)占用較多的邏輯資源。將公式變形為:
Gt = Gb+dx(Gc-Gb)+dy(Ga-Gb)+dxdy(Gb-Ga-Gc+Gd)
= Gb+dx(Gc-Gb)+dy(Ga-Gb)+dxdy[(Gb-Ga)+(Gd-Gc)](2-2)
公式(2-2)是另一種簡(jiǎn)化了電路的表示方法,僅需要4個(gè)乘法器、4 個(gè)減法器和3 個(gè)加法器。計(jì)算結(jié)果會(huì)有5個(gè)時(shí)鐘周期的延時(shí),當(dāng)像素時(shí)鐘為27Mhz,計(jì)算的時(shí)鐘為一幀的數(shù)據(jù)轉(zhuǎn)換為852*480*(1/27Mhz)=15ms,即可以實(shí)現(xiàn)實(shí)時(shí)的分辨率調(diào)整。
(4)YCbCr 4:2:2轉(zhuǎn)YCbCr 4:4:4數(shù)據(jù)模塊
將YCbCr4:4:4數(shù)據(jù)轉(zhuǎn)換到Y(jié)CbCr4:2:2是數(shù)字視頻中的一個(gè)選通功能。而將YCbCr4:2:2數(shù)據(jù)轉(zhuǎn)換到Y(jié)CrCb4:4:4即是重采樣的過(guò)程,采樣的數(shù)據(jù)格式轉(zhuǎn)變?nèi)鐖D7所示。
可知,輸入16位YCbCr轉(zhuǎn)換成了相應(yīng)各8位Y、Cb、Cr信號(hào),且輸出像素采樣率比輸入采樣率快了一倍,由此可見YCbCr4:2:2的數(shù)據(jù)格式壓縮了將近一半的數(shù)據(jù)帶寬。
(5)YCbCr444-RGB模塊
將YCbCr數(shù)據(jù)轉(zhuǎn)換為RGB數(shù)據(jù)可由下圖8所示數(shù)據(jù)關(guān)系得到。由于FPGA進(jìn)行浮點(diǎn)運(yùn)算較為復(fù)雜,且占用的時(shí)鐘周期較長(zhǎng)(比如16位的浮點(diǎn)加法電路,一般多達(dá)十幾到二三十個(gè)時(shí)鐘周期),并不適合于實(shí)時(shí)視頻數(shù)據(jù)處理,所以先通過(guò)對(duì)上式左右二端放大128倍化為整數(shù)運(yùn)算,計(jì)算后再對(duì)結(jié)果除以128(右移7位),即可獲得正確的結(jié)果。
(6)LCOS時(shí)序控制模塊
LCOS時(shí)序發(fā)生器主要用于產(chǎn)生微顯示器件所需的時(shí)序,包括提供像素時(shí)鐘(clk)、行同步信號(hào)(hsync)、場(chǎng)同步信號(hào)(vsync)、有效信號(hào)(valid),并輸出當(dāng)前行、列像素坐標(biāo)值,從幀緩沖區(qū)發(fā)出數(shù)據(jù)請(qǐng)求信號(hào)并讀出紅、綠、藍(lán)的視頻數(shù)據(jù)。LCOS的時(shí)序仿真圖如下圖9所示。
3 FPGA紅藍(lán)3D視頻獲取及主觀評(píng)價(jià)
FPGA選用的是Altera公司的Cyclone IV系列的EP4CE30F23C6N這款高速FPGA芯片,F(xiàn)PGA和DDR2之間的時(shí)鐘頻率可以達(dá)到200M,DDR2內(nèi)部時(shí)鐘頻率達(dá)到400M,充分滿足了兩路視頻處理的要求。通過(guò)對(duì)視頻處理過(guò)程中模塊的編寫,編譯后其消耗的的邏輯單元數(shù)為13615個(gè),僅占總邏輯單元數(shù)的47%,如下圖11所示,使視頻處理過(guò)程更加簡(jiǎn)便高效。將以上各模塊搭建、調(diào)試、下載到FPGA中,并采用鎂光公司的LCOS芯片作為微顯示器件,攝像頭采集到的《阿凡達(dá)》2D電影的一個(gè)畫面轉(zhuǎn)換為3D換面效果如下圖12所示,可以看到圖面中的人物具有視差的紅藍(lán)兩路圖像,佩戴上紅藍(lán)3D眼鏡,即可看到人物出屏的效果。
目前針對(duì)于3D顯示的評(píng)價(jià)的方法主要還是主觀的評(píng)價(jià)方法,按照2000年國(guó)際電信聯(lián)盟發(fā)布的ITU-R BT.1438立體電視圖像主觀評(píng)價(jià)標(biāo)準(zhǔn),分為5級(jí),即優(yōu)秀、良好、一般、不好、壞五個(gè)級(jí)別。以立體圖片上的一點(diǎn)為中心,單眼左右移動(dòng)時(shí),圖像會(huì)出現(xiàn)連續(xù)的跳躍,兩次跳躍之間眼睛移動(dòng)的角度為立體圖像的視變角,視角越大,觀看越舒適,但視角變大意味著立體感減弱。通過(guò)多人觀看本文的3D視頻,本設(shè)計(jì)主觀評(píng)價(jià)在良好級(jí)別,達(dá)到了預(yù)期的設(shè)計(jì)效果。
4 結(jié)束語(yǔ)
本文實(shí)現(xiàn)了一種結(jié)合Altera公司生產(chǎn)的Cyclone IV系列FPGA的3D視頻前端處理與顯示系統(tǒng),具有設(shè)計(jì)周期短、結(jié)構(gòu)簡(jiǎn)單、穩(wěn)定可靠、實(shí)現(xiàn)效果逼真、節(jié)約設(shè)計(jì)成本的優(yōu)點(diǎn)。高速圖像采集系統(tǒng)中采用FPGA作為采集控制部分,不僅可以提高系統(tǒng)處理的速度,還可以提高系統(tǒng)的靈活性和適應(yīng)性。彌補(bǔ)了當(dāng)前3D電視芯片缺少的問題,對(duì)原有的視頻處理過(guò)程及顯示器件進(jìn)行了改進(jìn),并提出了一種簡(jiǎn)便性和普適性的圖像增強(qiáng)算法。該系統(tǒng)在安防監(jiān)控、倒車影像、圖像分析、影視拍攝和投影顯示等方面都具有廣泛的應(yīng)用前景。
評(píng)論