音頻中的壓縮:降低采樣率、降低位深度、減少通道數(shù)
在一切開始之前有個問題要問大家:為什么要對一個文件進(jìn)行壓縮呢?茫然的你決定暫時不管這個問題去下載點東西,打開了“網(wǎng)抑云”之后你在每日推薦里找到了幾首喜歡的歌,心潮澎湃的你覺得遇到了真愛,于是立刻點擊了下載想把這幾首歌占為己有。在下載選項里你發(fā)現(xiàn)有最高音質(zhì)、極高音質(zhì)、一般音質(zhì)幾種選項。你覺得聽歌肯定要照顧自己的耳朵,于是選了最高音質(zhì),結(jié)果“網(wǎng)抑云”喊你沖會員,于是你一氣之下... 選了極高音質(zhì)。
本文引用地址:http://cafeforensic.com/article/202303/444083.htm回想剛剛的問題,你突然覺得極高音質(zhì)是不是就是最高音質(zhì)進(jìn)行了一些壓縮呢?因為極高音質(zhì)的文件大小比最高音質(zhì)要小一些。答案當(dāng)然是肯定的。雖然極高音質(zhì)的音質(zhì)不如最高音質(zhì)來的 nice,但是更小的文件占用的磁盤空間更小,也更方便數(shù)據(jù)的傳輸,因此壓縮技術(shù)對音頻十分重要。當(dāng)然,壓縮技術(shù)也可以誘使人氪金...
扯遠(yuǎn)了,那現(xiàn)在我們來了解一下音頻中的壓縮思路吧。首先,我們看一看文件大小的公式:
文件大?。╢ile size) = 時長(duration) * 采樣率(sampling rate) * 位深度(bit depth) * 通道數(shù)(number of channels)
由于一個音頻的時長是無法改變的,所以我們只能從降低采樣率 / 降低位深度 / 減少通道數(shù)入手。
先來看看采樣率(sampling rate)。采樣率越高,一段音頻的品質(zhì)就越好。常用的采樣率如圖所示:
可以看到最低的采樣率是 11025Hz,用于語音和調(diào)幅(AM)廣播??梢钥吹剑{(diào)頻(FM)廣播的采樣率是調(diào)幅(AM)的兩倍,這也是為什么我們平常在私家車上收聽廣播一般選擇 FM xxx 而不是 AM xxx 的原因,因為 FM 的音質(zhì)更好。感興趣的話可以下次坐車時聽聽兩種廣播,進(jìn)行一下對比。
音頻壓縮的另一種思路是降低位深度(bit-depth)。常用的位深度有 8 位和 16 位,將一個大小為 10MB 左右的 16 位音頻文件壓縮到 8 位,其文件大小能減小 5MB 左右。一般來說,普通的語音(對音質(zhì)沒有太高要求)的位深度為 8 位,而對于對音質(zhì)要求較高的音樂來說,位深度通常為 16 位,畢竟沒人愿意聽全是噪音的歌曲。
那什么是通道數(shù)呢?一般來說,立體聲(stereophonic audio)是一種聲音復(fù)制(sound reproduction)的方法,一般來說至少有兩個音頻通道,這樣就能造成“我聽到了從兩個方向傳來的聲音耶!”的感覺,使音頻立體化,更貼近自然音頻。對于一個有兩個音頻通道的立體聲而言,只要減少一個通道,音頻文件的大小就會減半。然而,這種操作會對聲音造成損害,因此只適合適用于短促的音效或語音中,并不適合使用于音樂中。
此外,音頻文件不適于無損壓縮,因為具有相同值的連續(xù)音頻樣本并不常見。常用的音頻壓縮方式是有損壓縮,譬如 mp3。但 mp3 提供了一個良好的壓縮率,同時保持音頻的質(zhì)量。
評論