基于LZW算法的數(shù)據(jù)無(wú)損壓縮硬件實(shí)現(xiàn)
當(dāng)前數(shù)據(jù)壓縮技術(shù)分為有損壓縮和無(wú)損壓縮,算術(shù)編碼、游程編碼、霍夫曼和LZW壓縮是傳統(tǒng)的數(shù)據(jù)壓縮方法,屬于無(wú)損數(shù)據(jù)壓縮;而基于小波變換的數(shù)據(jù)壓縮和基于神經(jīng)網(wǎng)絡(luò)的編碼方式是近年來(lái)新發(fā)展起來(lái)的現(xiàn)代數(shù)據(jù)壓縮方法,屬于有損數(shù)據(jù)壓縮。本研究主要探討一種基于LZW算法的數(shù)據(jù)無(wú)損壓縮硬件實(shí)現(xiàn)。
本文引用地址:http://cafeforensic.com/article/150866.htmLZW壓縮算法在壓縮的過(guò)程中自適應(yīng)建立一個(gè)字典,以后的數(shù)據(jù)同字典中的數(shù)據(jù)相匹配,匹配上則輸出字典的索引。由于表示字典的索引所用的比特?cái)?shù)遠(yuǎn)小于字符的比特?cái)?shù),從而達(dá)到壓縮的效果。這個(gè)生成的字典不需要隨著壓縮的數(shù)據(jù)一同傳輸,而是能夠根據(jù)壓縮的數(shù)據(jù)在解壓時(shí)重新動(dòng)態(tài)生成一模一樣的字典。
LZW編碼原理如圖1所示,在進(jìn)行壓縮時(shí)首先把字典中的前256(0~255)項(xiàng)初始為全部的256個(gè)8位字符,分別為十進(jìn)制數(shù)0~255。當(dāng)輸入第一個(gè)字符時(shí),總是在字典中可以找到,直到新的字符X不在字典詞條中時(shí),便將字符串IX加入到字典的第256項(xiàng),以此類(lèi)推。以字符串流5,6,7,8,9,5,5,6,6,7,8,9,5,…為例,表1給出了字典存儲(chǔ)的物理結(jié)構(gòu)和壓縮過(guò)程中字典項(xiàng)的讀寫(xiě)示意。壓縮后編碼輸出為5,6,7,8,9,5,256,257,259,…。
傳統(tǒng)的LZW壓縮算法采用8位數(shù)據(jù)輸入,固定長(zhǎng)度編碼輸出,隨著字典內(nèi)容的不斷增多,輸出編碼的位數(shù)不斷增加勢(shì)必造成資源的浪費(fèi),也會(huì)損失壓縮率。另外,由于字典的容量有限,隨著壓縮過(guò)程的進(jìn)行,字典會(huì)被填滿(mǎn),若是簡(jiǎn)單的不再向字典中增加內(nèi)容,那么后面的壓縮率就會(huì)降低,而如果將字典全部清除重新建立字典,在字典建立初期壓縮率也是很低的。針對(duì)以上不足,文獻(xiàn)對(duì)LZW算法做以下改進(jìn):采用12位數(shù)據(jù)作為壓縮輸入,變長(zhǎng)度的碼字輸出。
壓縮字典最多可容納16 384個(gè)碼,共分為三部分,其中0~4 095為12位輸出,4 096~8 191為13位,8 192~16 383為14位。每當(dāng)輸出長(zhǎng)度變化時(shí),同時(shí)輸出一個(gè)變長(zhǎng)標(biāo)識(shí),便于解碼器解碼。
評(píng)論