MPEG-4視頻編碼技術(shù)在多媒體通信應(yīng)用中的解決方案
采用MPGE-4標(biāo)準(zhǔn),實現(xiàn)基于內(nèi)容的編碼和編碼可分級性,其核心編碼器的結(jié)構(gòu)如圖3所示:基本層采用的是MPEG-4基本模式編碼,并輸出基本視頻流,增強層的輸入信號是原始VOP和幀存(重建)的VOP的差值,并對其差值進(jìn)行8×8的DCT,然后對DCT系數(shù)進(jìn)行比特平面編碼。根據(jù)比特平面的重要性,將重要的比特放在碼流前端,如一個塊的MSB,將次要比特放在后端,比如一個塊的LSB,這樣在網(wǎng)絡(luò)發(fā)生擁塞時就可以先丟棄部分不重要的比特以減緩網(wǎng)絡(luò)負(fù)載,但解碼端對接收碼流仍可解碼,只是圖像質(zhì)量會有所下降。解碼器是編碼器的逆過程。
3)采用MPEG-4標(biāo)準(zhǔn)的視頻壓縮的特點
①傳統(tǒng)編碼與基于內(nèi)容編碼的統(tǒng)一
MPEG-4視頻算法的核心是支持基于內(nèi)容(Content-based)的編碼和解碼功能,也就是對場景中使用分割算法抽取的單獨的物理對象進(jìn)行編碼和解碼。為了實現(xiàn)預(yù)想的內(nèi)容及交互等功能,MPEG-4引進(jìn)了一個叫做“視頻對象面”(VideoObjectPlane,簡寫為VOP)的概念,如圖4所示。圖4(a)表示支持MPEG-1和MPEG-2的普通MPEG-4編碼器,它把視頻圖像都認(rèn)為是一個矩形區(qū),圖4(b)表示MPEG-4的甚低碼率圖像(VLVB)的核心編碼器。它是假設(shè)每幀圖像被分割成許多任意形狀的對象,每個對象都有可能覆蓋描述場景中感興趣的物理對象或者內(nèi)容,這被定義為VOP.然后單獨對VOP的形狀、運動和紋理信息進(jìn)行編碼和傳送構(gòu)成一個單獨的視頻對象層(VideoObject Layer,簡寫為VOL)。此外,還需要標(biāo)識每個VOL的信息也包含在編碼后的比特流(Bitstream)中,也包括各種VOL的視頻圖像在接收端應(yīng)該如何進(jìn)行重新組合的信息,以便重構(gòu)完整的原始圖像序列。這樣就可以對每個VOP進(jìn)行單獨解碼,提供了管理視頻序列的靈活性。
如果輸入圖像序列只包含標(biāo)準(zhǔn)的矩形圖像,就不需要形狀編碼,在這種情況下,MPEG-4Video使用的編碼算法結(jié)構(gòu)也就與MPEG-1和MPEG-2使用的算法結(jié)構(gòu)相同。②實現(xiàn)編碼的連續(xù)可分級性
MPEG-4第4版針對Internet視頻流式傳輸?shù)膽?yīng)用,定義了視頻圖像編碼的精細(xì)可分級性(FGS,即FineGranularityScalability)及其實現(xiàn)工具。由于FGS編碼提出了一個由網(wǎng)絡(luò)接收端來控制其所接收的碼流的概念,使其在Internet上的傳輸更具適應(yīng)性。
在視頻的分級編碼技術(shù)中,視頻信息被分成多個不同重要性的層,其中基本層包含了視頻對象中最重要的基本信息,以此可以保證一個最基本的圖像質(zhì)量,在傳輸過程中被賦予較高的優(yōu)先級。增強層的作用是在基本層的基礎(chǔ)上進(jìn)一步提高圖像質(zhì)量,在傳輸中賦予較低的優(yōu)先級。這樣在網(wǎng)絡(luò)發(fā)生擁塞而丟包時,就可以先丟棄優(yōu)先級較低的增強層,使得基本層發(fā)生丟包或誤碼的概率比增強層低,從而保證重建圖像仍然有一個讓人可以接受的質(zhì)量。
4)語音壓縮
采用CELP(CodeExcitedLinearPredication)碼激勵線性預(yù)測技術(shù)。傳統(tǒng)的CELP編碼器提供單一的碼率的壓縮,而本系統(tǒng)允許多種應(yīng)用使用一個基本的編碼器,在碼率和帶寬上提供了可擴展性。根據(jù)不同應(yīng)用需要可選擇8 kHz和16 kHz 2種采樣頻率,8kHz采樣頻率對應(yīng)100~3 800 Hz帶寬的通信質(zhì)量,16 kHz采樣頻率對應(yīng)50~7 000 Hz帶寬的通信質(zhì)量。
4)外部設(shè)備接口模塊
本系統(tǒng)采用的PHILIP公司的視頻編碼芯片SAA7111,對模擬攝像機的輸入模擬視頻信號進(jìn)行亮色分離,再對分離后的信號分別進(jìn)行8比特采樣。
評論