數(shù)字電視信源編碼的主要技術(shù)與標(biāo)準(zhǔn)
一.數(shù)字電視的信源編碼
一個(gè)完整的數(shù)字電視系統(tǒng)包括數(shù)字電視信號的產(chǎn)生、處理、傳輸、接收和重現(xiàn)等諸多環(huán)節(jié)。數(shù)字電視信號在進(jìn)入傳輸通道前的處理過程一般如圖1所示:
電視信號在獲取后經(jīng)過的第一個(gè)處理環(huán)節(jié)就是信源編碼。信源編碼是通過壓縮編碼來去掉信號源中的冗余成分,以達(dá)到壓縮碼率和帶寬,實(shí)現(xiàn)信號有效傳輸?shù)哪康?。信道編碼是通過按一定規(guī)則重新排列信號碼元或加入輔助碼的辦法來防止碼元在傳輸過程中出錯(cuò),并進(jìn)行檢錯(cuò)和糾錯(cuò),以保證信號的可靠傳輸。信道編碼后的基帶信號經(jīng)過調(diào)制,可送入各類通道中進(jìn)行傳輸。目前數(shù)字電視可能的傳輸通道包括衛(wèi)星,地面無線傳輸和有線傳輸?shù)取?BR>
信源編碼的目的是通過在編碼過程中對原始信號冗余度的去除來壓縮碼率,因此壓縮編碼的技術(shù)與標(biāo)準(zhǔn)成為信源編碼的核心。九十年代以來,各種壓縮編碼的國際標(biāo)準(zhǔn)相繼推出,其中MPEG-2是專為數(shù)字電視《包括標(biāo)準(zhǔn)數(shù)字電視和數(shù)字高清晰度電視》制定的壓縮編碼標(biāo)準(zhǔn)。MPEG-2壓縮編碼輸出的碼流作為數(shù)字電視信源編碼的標(biāo)準(zhǔn)輸出碼流已被廣泛認(rèn)可。目前數(shù)字電視系統(tǒng)中信源編碼以外的其他部分,包括信道編碼,調(diào)制器,解調(diào)器等,大都以MPEG-2碼流作為與之適配的標(biāo)準(zhǔn)數(shù)字信號碼流。
信源編碼的第一步首先要對模擬電視信號進(jìn)行取樣和模數(shù)變換,相應(yīng)的需要一個(gè)統(tǒng)一的標(biāo)準(zhǔn)。數(shù)字演播室標(biāo)準(zhǔn)ITU-R601正是為此制定的國際標(biāo)準(zhǔn)。
二.數(shù)字演播室標(biāo)準(zhǔn)ITU-R601
早在七十年代末,英國廣播公司和索尼公司就分別展示了其各自開發(fā)的彩色數(shù)字錄像機(jī),成為最早的數(shù)字電視編錄產(chǎn)品,由此促成了電視信號模數(shù)轉(zhuǎn)換規(guī)范的產(chǎn)生。1980年,國際無線電咨詢委員會CCIR提出了電視信號模數(shù)轉(zhuǎn)換標(biāo)準(zhǔn)的建議,即稱為數(shù)字演播室標(biāo)準(zhǔn)的CCIR601。后來CCIR成為國際電信聯(lián)盟的無線電委員會,稱為ITU-R,相應(yīng)的CCIR-601也改稱ITU-R601,成為模擬電視向數(shù)字電視轉(zhuǎn)變過程中的第一個(gè)標(biāo)準(zhǔn)規(guī)范。
ITU-R601主要是一種取樣標(biāo)準(zhǔn)。模擬電視信號據(jù)此取樣后進(jìn)行8比特量化和線性PCM編碼,即可得到符合數(shù)字演播室標(biāo)準(zhǔn)的基帶數(shù)字信號。但是,由此得到的數(shù)字電視信號具有非常高的碼率和帶寬,難以進(jìn)入實(shí)用。雖然ITU-R601建議早在1980年已經(jīng)制定,但直到九十年代一系列有效的圖像數(shù)碼壓縮技術(shù)及相應(yīng)的國際標(biāo)準(zhǔn)出現(xiàn)以后,數(shù)字電視才得到了迅速的發(fā)展。
圖像數(shù)據(jù)的壓縮主要基于對各種圖像數(shù)據(jù)冗余度及視覺冗余度的壓縮,包括如下一些方法:
1.統(tǒng)計(jì)冗余度的壓縮:對于一串由許多數(shù)值構(gòu)成的數(shù)據(jù)來說,如果其中某些值經(jīng)常出現(xiàn),而另外一些值很少出現(xiàn),則這種由取值上的統(tǒng)計(jì)不均勻性就構(gòu)成了統(tǒng)計(jì)冗余度,可以對之進(jìn)行壓縮。具體方法是對那些經(jīng)常出現(xiàn)的值用短的碼組來表示,對不經(jīng)常出現(xiàn)的值用長的碼組來表示,因而最終用于表示這一串?dāng)?shù)據(jù)的總的碼位,相對于用定長碼組來表示的碼位而言得到了降低,這就是熵編碼的思想。目前用于圖像壓縮的具體的熵編碼方法主要是霍夫曼編碼,即一個(gè)數(shù)值的編碼長度與此數(shù)值出現(xiàn)的概率盡可能地成反比。霍夫曼編碼雖然壓縮比不高,約為1.6:1,但好處是無損壓縮,目前在圖像壓縮編碼中被廣泛采用。
視頻圖像在每一點(diǎn)的取值上具有任意性。對于運(yùn)動圖像而言,每一點(diǎn)在一段時(shí)間內(nèi)能取可能的任意值,在取值上具有統(tǒng)計(jì)均勻性,難以直接運(yùn)用熵編碼的方法,但可以通過適當(dāng)?shù)淖儞Q編碼的方法,如DCT變換,使原圖像變成由一串統(tǒng)計(jì)不均勻的數(shù)據(jù)來表示,從而利用霍夫曼編碼來進(jìn)行壓縮。
2.空間冗余度的壓縮:一幅視頻圖像相鄰各點(diǎn)的取值往往相近或相同,具有空間相關(guān)性,這就是空間冗余度。圖像的空間相關(guān)性表示相鄰象素點(diǎn)取值變化緩慢。從頻域的觀點(diǎn)看,意味著圖像信號的能量主要集中在低頻附近,高頻信號的能量隨頻率的增加而迅速衰減。通過頻域變換,可以將原圖像信號用直流分量及少數(shù)低頻交流分量的系數(shù)來表示,這就是變換編碼中的正交余弦變換DCT的方法。DCT是JPEG和MPEG壓縮編碼的基礎(chǔ),可對圖像的空間冗余度進(jìn)行有效的壓縮。
視頻圖像中經(jīng)常出現(xiàn)一連串連續(xù)的象素點(diǎn)具有相同值的情況,典型的如彩條,彩場信號等。只傳送起始象素點(diǎn)的值及隨后取相同值的象素點(diǎn)的個(gè)數(shù),也能有效地壓縮碼率,這就是行游程編碼。目前在圖像壓縮編碼中,行游程編碼并不直接對圖像數(shù)據(jù)進(jìn)行編碼,主要用于對量化后的DCT系數(shù)進(jìn)行編碼。
3.時(shí)間冗余度的壓縮:時(shí)間冗余度表現(xiàn)在電視畫面中相繼各幀對應(yīng)象素點(diǎn)的值往往相近或相同,具有時(shí)間相關(guān)性。在知道了一個(gè)象素點(diǎn)的值后,利用此象素點(diǎn)的值及其與后一象素點(diǎn)的值的差值就可求出后一象素點(diǎn)的值。因此,不傳送象素點(diǎn)本身的值而傳送其與前一幀對應(yīng)象素點(diǎn)的差值,也能有效地壓縮碼率,這就是差分編碼DPCM。在實(shí)際的壓縮編碼中,DPCM主要用于各圖像子塊在DCT變換后的直流系數(shù)的傳送。相對于交流系數(shù)而言,DCT直流系數(shù)的值很大,而相繼各幀對應(yīng)子塊的DCT直流系數(shù)的值一般比較接近,在圖像未發(fā)生跳變的情況下,其差值同直流系數(shù)本身的值相比是很小的。
由差分編碼進(jìn)一步發(fā)展起來的預(yù)測編碼,是根據(jù)一定的規(guī)則先預(yù)測出下一個(gè)象素點(diǎn)或圖像子塊的值,然后將此預(yù)測值與實(shí)際值的差值傳送給接收端。目前圖像壓縮中的預(yù)測編碼主要用于幀間壓縮編碼,方法是先根據(jù)一個(gè)子塊的運(yùn)動矢量求出下一幀對應(yīng)子塊的預(yù)測值及其與實(shí)際值的差值,接收端根據(jù)運(yùn)動矢量及差值恢復(fù)出原圖像。由于運(yùn)動矢量及差值的數(shù)據(jù)量低于原圖像的數(shù)據(jù)量,因而也能達(dá)到圖像數(shù)據(jù)壓縮的目的。
4.視覺冗余度的壓縮:視覺冗余度是相對于人眼的視覺特性而言的。人眼對于圖像的視覺特性包括:對亮度信號比對色度信號敏感,對低頻信號比對高頻信號敏感,對靜止圖像比對運(yùn)動圖像敏感,以及對圖像水平線條和垂直線條比對斜線敏感等。因此,包含在色度信號,圖像高頻信號和運(yùn)動圖像中的一些數(shù)據(jù)并不能對增加圖像相對于人眼的清晰度作出貢獻(xiàn),而被認(rèn)為是多余的,這就是視覺冗余度。
壓縮視覺冗余度的核心思想是去掉那些相對人眼而言是看不到的或可有可無的圖像數(shù)據(jù)。對視覺冗余度的壓縮通常已反映在各種具體的壓縮編碼過程中。如對于DCT系數(shù)的直流與低頻部分采取細(xì)量化,而對高頻部分采取粗量化,使得DCT變換能借此壓縮碼率,并能有效地進(jìn)行行游程編碼。在幀間預(yù)測編碼中,大碼率壓縮的預(yù)測幀及雙向預(yù)測幀的采用,也是利用了人眼對運(yùn)動圖像細(xì)節(jié)不敏感的特性。
圖像壓縮編碼的具體方法雖然還有多種,但大都是建立在上述基本思想之上的。DCT變換,行游程編碼,DPCM,幀間預(yù)測編碼及霍夫曼編碼等編碼方法,因技術(shù)上的成熟,已被有關(guān)國際組織定為壓縮編碼的主要方法。
三.圖像壓縮的主要技術(shù)與標(biāo)準(zhǔn)
目前有關(guān)圖像壓縮方面的主要標(biāo)準(zhǔn)包括CCITT的H.261,JPEG和MPEG。是分別針對電視電話圖像,靜止圖像和活動圖像的壓縮編碼標(biāo)準(zhǔn)。這幾種壓縮標(biāo)準(zhǔn)雖然各自針對性不同,但壓縮編碼方法大體相似。
1 H.261
圖像壓縮編碼標(biāo)準(zhǔn)的提出最早源于通訊中對可視電話的研究。經(jīng)過多年努力,至1980年,國際電報(bào)電話咨詢委員會CCITT所屬的視頻編碼專家組的H.261建議被通過,成為可視電話和電話會議的國際標(biāo)準(zhǔn)。H.261又稱Px64,傳輸碼率為Px64kbps,其中P=1-30可變,根據(jù)圖像傳輸清晰度的不同,碼率變化范圍在64kbps至1.92Mbps之間,編碼方法包括DCT變換,可控步長線性量化,變長編碼及預(yù)測編碼等。其簡化的編碼原理框圖如圖2所示。
圖中,DCT變換的輸入輸出選擇開關(guān)由幀內(nèi)/幀間模式選擇電路控制。在幀內(nèi)模式時(shí),開關(guān)打到上面,輸入信號經(jīng)DCT變換,線性量化和變長編碼后輸出,圖像只進(jìn)行幀內(nèi)壓縮。在幀間模式時(shí),開關(guān)打到下面,前一幀圖像信號經(jīng)過預(yù)測環(huán)中的運(yùn)動補(bǔ)償后產(chǎn)生一個(gè)后幀的預(yù)測信號。后幀的實(shí)際輸入信號與其預(yù)測值相減后,在進(jìn)行一個(gè)幀內(nèi)壓縮編碼的過程后輸出。
評論