多媒體技術(shù)應用之聲音編碼技術(shù)分析
前言
本文引用地址:http://cafeforensic.com/article/165786.htm多媒體數(shù)據(jù)類型主要有一下幾個方面:
·圖形和圖像:圖像由象素組成;圖形由圖元組成
文本:最基本的,有多中編碼方式, ASCII碼, 中文的GB碼等等
音頻:WAV文件是計算機中最基礎(chǔ)的聲音記錄形式,對聲波信號進行采樣,采樣后經(jīng)過量化形成數(shù)字信號。MIDI格式的數(shù)據(jù)記錄的實際是樂譜(數(shù)字音視頻技術(shù))。
·動畫和視頻: 動畫是用計算機生成一系列可供實時演播的連續(xù)畫面技術(shù)。視頻是由一幅幅拍攝下來的真實畫面序列組成。
通常情況下,我們將利用計算機技術(shù)把文本、圖像、圖形、動畫、音頻及視頻等多種媒體綜合一體化,使之建立起邏輯上的聯(lián)系,并能夠?qū)λ鼈儷@取,編碼,編輯,處理,存儲,傳輸和再現(xiàn)的技術(shù)稱之為多媒體技術(shù)。在實際生活中多媒體技術(shù)應用是非常廣泛的,下面小編以多媒體技術(shù)中聲音編碼技術(shù)為例(音視頻技術(shù)),詳細介紹實際生活中有關(guān)多媒體技術(shù)應用的相關(guān)知識。
1.G.721 ADPCM編碼器
ADPCM 是利用樣本與樣本之間的高度相關(guān)性和量化階自適應來壓縮數(shù)據(jù)的一種波形編碼技術(shù)。
CCITT 為此制定了 G.721 推薦標準 , 這個標準叫做 32kb/s 自適應差分脈沖Differential Pulse Code Modulation to 24and 40kb/s for Digital Circuit Multiplication Equipment Application , 使用該標準的編碼器的數(shù)據(jù)率可降低到 40kb/s 和24kb/s 。
CCITT 推薦的 G.721 ADPCM 標準是一個代碼轉(zhuǎn)換系統(tǒng)。它使用 ADPCM 轉(zhuǎn)換技術(shù) , 實現(xiàn) 64kb/s A 律或μ律 PCM 速率和 32kb/s 速率之間的相互轉(zhuǎn)換。
2.子帶編碼 (SBC)
子帶編碼主要過程是:
①使用一組帶通濾波器 (band-pass filter ,BPF) 把輸入音頻信號的頻帶分成若干個連續(xù)的頻段 , 每個頻段稱為子帶。
②對每個子帶中的音頻信號采用單獨的編碼方案去編碼。
③在信道上傳送時 , 將每個子帶的代碼復合起來。
④在接收端譯碼時 , 將每個子帶的代碼單獨譯碼 , 然后把它們組合起來 , 還原成原來的音頻信號。
采用對每個子帶分別編碼的好處:
第一.對每個子帶信號分別進行自適應控制,量化階(quantization step) 的大小可以按照每個子帶的能量電平加以調(diào)節(jié)。具有較高能量電平的子帶用大的量化階去量化 , 以減少總的量化噪聲。
·第二,可根據(jù)每個子帶信號在感覺上的重要性 , 對每個子帶分配不同的位數(shù) , 用來表示每個樣本值。例如 ,在低頻子帶中,為了保護音調(diào)和共振峰的結(jié)構(gòu),就要求較小的量化階、較多的量化級數(shù), 即分配較多的位數(shù)來表示樣本值。而話音中的摩擦音和類似噪聲的聲音,通常出現(xiàn)在高頻子帶中,對它分配較少的位數(shù)。
3. 子帶-自適應差分脈沖編碼調(diào)制(SB-ADPCM)
采樣率為 8kHz 、 8 位 / 樣本、數(shù)據(jù)率為 64kb/s 的 G.711 標準是 CCITT 為話音信號頻率為 (300~3400)Hz制定的編譯碼標準, 這屬于窄帶音頻信號編碼。現(xiàn)代的話音編碼技術(shù)已經(jīng)可以減少數(shù)據(jù)率 ,而又不至于顯著降低音質(zhì)。 CCITT 推薦的 8KHz 采樣率、 4 位 / 樣本、 32kb/s 的 G.721 標準, 以及 G.721 的擴充標準 G.723, 都說明了話音壓縮編碼技術(shù)的進展。
G.722 是 CCITT 推薦的音頻信號編碼譯碼標準。該標準是描述音頻信號帶寬為 7kHz、數(shù)據(jù)率為 64kb/s 的編譯碼原理、算法和計算細節(jié)。
G.722 的主要目標是保持 64kb/s 的數(shù)據(jù)率 , 而音頻信號的質(zhì)量要明顯高于 G.711 的質(zhì)量。 G.722 標準把音頻信號采樣頻率由 8kHz 提高到 16KHz, 是 G.711PCM 采樣率的 2 倍 , 因而要被編碼的信號頻率由原來的 3.4kHz 擴展到 7kHz 。這就使音頻信號的質(zhì)量有很大改善 , 由數(shù)字電話的話音質(zhì)量提高到調(diào)幅 (AM) 無線電廣播的質(zhì)量。對話音信號質(zhì)量來說 , 提高采樣率并無多大改善 , 但對音樂一類信號來說 , 其質(zhì)量卻有很大提高。
G.722編譯碼系統(tǒng)采用自帶自適應差分脈沖編碼調(diào)制技術(shù),把頻帶分成兩個等帶寬的子代分別是高頻子帶和低頻子帶。在每個等帶寬的子帶中的信號都用ADPCM進行編碼。
4.G.722 SB-ADPCM編譯碼器
為了適應可視電話會議日益增長的迫切需要 ,1988年CITT 為此制定了G.722 推薦標準, 叫做 數(shù)據(jù)率為 64kb/s 的 7KHz 聲音信號編碼—— 7kHz Audio-coding with 64kb/s。這個標準把話音信號的質(zhì)量由電話質(zhì)量提高到AM 無線電廣播質(zhì)量, 而其數(shù)據(jù)傳輸率仍保持為 64kb/s 。
寬帶話音是指帶寬在 (50~7000)Hz的話音 , 這種話音在可懂度和自然度方面都比帶寬為 (300~3400)Hz 的話音有明顯的提高, 也更容易識別對方的說話人。
5. 線性預測編碼(LPC)
線性預測編碼是一種非常重要的編碼方法。從原理上講 ,LPC 是通過分析話音波形來產(chǎn)生聲道激勵和轉(zhuǎn)移函數(shù)的參數(shù),對聲音波形的編碼實際就轉(zhuǎn)化為對這些參數(shù)的編碼,這就使聲音的數(shù)據(jù)量大大減少。在接收端使用 LPC 分析得到的參數(shù) , 通過話音合成器重構(gòu)話音。
合成器實際上是一個離散的隨時間變化的時變線性濾波器,它代表人的話音生成系統(tǒng)模型 。時變線性濾波器既當作預測器使用 , 又當作合成器使用。分析話音波形時 , 主要是當作預測器使用。隨著話音波形的變化,周期性地使模型地參數(shù)和激勵條件適合新的要求。
多媒體技術(shù)應用前景及展望
多媒體技術(shù)應用的前景
家庭教育和個人娛樂是目前國際多媒體市場的主流
內(nèi)容演示和管理信息系統(tǒng)是多媒體技術(shù)應用的重要方面
·多媒體通信和分布式多媒體系統(tǒng)是多媒體技術(shù)今后的發(fā)展方向
多媒體技術(shù)應用發(fā)展方向:
一是計算機系統(tǒng)本身的多媒體化;
二是多媒體技術(shù)與點播電視、智能化家電、識別網(wǎng)絡(luò)通信等技術(shù)互相結(jié)合,使多媒體技術(shù)進入教育、咨詢、娛樂。企業(yè)管理和辦公室自動化等領(lǐng)域;
三是多媒體技術(shù)與控制技術(shù)相互滲透,進入工業(yè)自動化測控等領(lǐng)域。
總結(jié)
真正的多媒體技術(shù)所涉及的對象是計算機技術(shù)的產(chǎn)物,而其他的單純事物,如電影、電視、音響等,均不屬于多媒體技術(shù)的范疇。本文以聲音編碼技術(shù)為例,詳細介紹實際生活中有關(guān)多媒體技術(shù)應用的相關(guān)知識及對多媒體技術(shù)應用未來發(fā)展前景作了簡單的分析.
鎖相環(huán)相關(guān)文章:鎖相環(huán)原理
評論