基于MSP430的語(yǔ)音與音頻壓縮/解壓縮技術(shù)
引言
本文引用地址:http://cafeforensic.com/article/81571.htm采用微控制器 (MCU) 來(lái)實(shí)施語(yǔ)音記錄器比較簡(jiǎn)單。許多 MCU 均采用集成模數(shù) (A/D) 轉(zhuǎn)換器。擴(kuò)音器將捕獲到的聲音提供給放大器,然后再饋送給 A/D 轉(zhuǎn)換器的模擬輸入??蓪浿频穆曇舸鎯?chǔ)在閃存或 RAM 等存儲(chǔ)器中,按下按鈕就能觸發(fā) MCU 以播放錄制到的聲音,其原理是將存儲(chǔ)的數(shù)據(jù)先提供給數(shù)模 (D/A) 轉(zhuǎn)換器,然后再提供給音頻功率放大器。
利用 MSP430 很容易實(shí)現(xiàn)這種語(yǔ)音記錄器。MSP430 微控制器利用集成外設(shè)來(lái)實(shí)現(xiàn)片上模擬信號(hào)鏈。此外,MSP430 的 CPU 處理能力非常強(qiáng)大,足以執(zhí)行錄制聲音的壓縮。
壓縮與解壓縮算法
舉例來(lái)說(shuō),實(shí)現(xiàn)語(yǔ)音記錄器的最簡(jiǎn)單辦法就是將 A/D 轉(zhuǎn)換器轉(zhuǎn)換結(jié)果(如 12 位采樣)直接存儲(chǔ)在閃存中。音頻數(shù)據(jù)大多數(shù)時(shí)間都不使用整個(gè) A/D 轉(zhuǎn)換器范圍,也就是說(shuō),冗余數(shù)據(jù)也存儲(chǔ)在閃存中。壓縮算法可去除這些冗余信息,從而減小所存儲(chǔ)數(shù)據(jù)的容量。
自適應(yīng)差分脈沖代碼調(diào)制 (ADPCM) 就是此種類(lèi)型的壓縮算法。ADPCM 算法存在各種類(lèi)型,但都使用量化器差分編碼與量化器中自適應(yīng)量化階步長(zhǎng)方案。在進(jìn)一步討論 IMA ADPCM 算法用于相關(guān)代碼之前,我們首要來(lái)簡(jiǎn)單介紹一下差分 PCM 編碼。
差分脈沖代碼調(diào)制 (DPCM)
DPCM 通過(guò)使用當(dāng)前采樣與前一個(gè)采樣的差值來(lái)對(duì)模擬音頻輸入信號(hào)進(jìn)行編碼。圖 1 顯示了DPCM 編碼器與解碼器的結(jié)構(gòu)圖。在本例中,我們用信號(hào)估算 Se(n) 而非前一個(gè)輸入來(lái)決定信號(hào)差值 d(n),從而確保了編碼器使用的信息與解碼器相同。如果編碼器使用的是上一個(gè)輸入采樣的話(huà),那么就會(huì)造成量化的累積錯(cuò)誤,從而使重建信號(hào)與原始輸入信號(hào)不同。通過(guò)采用如圖 1 所示的信號(hào)估算,我們能避免重建信號(hào) Sr(n) 與原始輸入信號(hào)出現(xiàn)差異。重建信號(hào) Sr(n) 是預(yù)測(cè)器 (predictor) 的輸入,其決定了下一個(gè)信號(hào)估算 Se(n+1)。
圖 2 顯示了一小段錄制音頻流,并通過(guò)兩個(gè)示意圖給出了模擬音頻輸入采樣(PCM 值)與連續(xù)采樣(DPCM 值)間差值的比較。
PCM 值的范圍在 26 到 203 之間,總共 177 個(gè)步長(zhǎng)。編碼的 DPCM 值范圍在-44 至 46之間,總共 90 個(gè)步長(zhǎng)。盡管量化器步長(zhǎng)僅為 1,但這種 DPCM 編碼已經(jīng)實(shí)現(xiàn)了輸入數(shù)據(jù)的壓縮功能。只需選擇較大的量化器步長(zhǎng)即可將編碼 DPCM 值的范圍進(jìn)一步縮小。
適應(yīng)差分脈沖編碼調(diào)制 (ADPCM)
ADPCM 是 DPCM 的一個(gè)變體,編碼器步長(zhǎng)會(huì)有差異。語(yǔ)音輸入信號(hào)的強(qiáng)度差異體現(xiàn)在不同的揚(yáng)聲器器上,也體現(xiàn)在語(yǔ)音輸入信號(hào)的語(yǔ)音和非語(yǔ)音部分上。量化器步長(zhǎng)對(duì)每個(gè)采樣都進(jìn)行適應(yīng)調(diào)節(jié),確保高低輸入信號(hào)強(qiáng)度都能實(shí)現(xiàn)同樣的編碼效率。圖 3 顯示了采用步長(zhǎng)調(diào)節(jié)技術(shù)的修訂版 DPCM結(jié)構(gòu)圖。
ADPCM 編碼器通過(guò)解碼 ADPCM 代碼進(jìn)行信號(hào)估算 (Se),這就是說(shuō),解碼器是 ADPCM 編碼器的一部分,因此已經(jīng)編碼的音頻數(shù)據(jù)流只能用解碼器進(jìn)行重放,這樣解碼器就必須對(duì)編碼器加以跟蹤。
最初的編碼器和解碼器信號(hào)估算等級(jí)以及步長(zhǎng)大小調(diào)節(jié)等級(jí)必須在開(kāi)始編碼或解碼前就加以定義,否則,編碼或解碼的值就會(huì)超過(guò)范圍。
MSP430 片上信號(hào)鏈
MSP430 系列微控制器支持多種片上外設(shè)。為了實(shí)現(xiàn)完整的片上信號(hào)鏈解決方案,MSP430 至少必須提供 1 個(gè) A/D 轉(zhuǎn)換器模擬輸入和 1 個(gè) D/A 轉(zhuǎn)換器。下面我們將介紹兩種 MSP430 解決方案。
MSP430F169 片上信號(hào)鏈解決方案
MSP430F169 包括 1 個(gè)集成 12 位 SAR A/D 轉(zhuǎn)換器,作為一種硬件乘法器模塊,它能高效支持?jǐn)?shù)字濾波器,此外 MSP430F169 還包括 1 個(gè)集成 12 位 D/A 轉(zhuǎn)換器模塊。圖4給出了 MSP430F169 信號(hào)鏈電路圖。
上述配置也適合采用外部串行閃存的情況,從而可以滿(mǎn)足音頻數(shù)據(jù)的存儲(chǔ)需求。外部閃存可通過(guò) MSP430 的 I2C 或 SPI 接口來(lái)連接。MSP430F169 DMA 模塊可自動(dòng)將接收到的數(shù)據(jù)傳輸給 RAM,從而大幅降低了 CPU 的負(fù)載。
MSP430FG4618 片上信號(hào)鏈解決方案
我們用 MSP430FG4618 可以實(shí)現(xiàn)另一種片上信號(hào)鏈解決方案。MSP430F169 可支持 60 KB 的集成閃存,而 MSP430FG4618 則可支持 116 KB 的閃存。MSP430FG4618 的另一優(yōu)勢(shì)在于,它還集成了運(yùn)算放大器模塊。運(yùn)算放大器可用于放大擴(kuò)音器的輸入及數(shù)模轉(zhuǎn)換器的模擬輸出。圖 5 顯示了 MSP430FG4618 信號(hào)鏈電路圖。具體配置采用的是TI推出的 MSP430FG4618/F2013 試驗(yàn)板。該評(píng)估板可與相關(guān)代碼示例配合使用。
擴(kuò)音器的輸出信號(hào)非常小,必須放大。MSP430 的運(yùn)算放大器可用于不同的運(yùn)算模式。如果用于 PGA 模式,那么最大只能放大到 15 倍,對(duì)擴(kuò)音器放大器來(lái)說(shuō)還不夠。因此,需要通過(guò)外部組件來(lái)加大增益。圖 5 中的運(yùn)算放大器 OA0 即用于通用放大器模式。放大器共有 8 種設(shè)置方式,可以使增益-帶寬乘積和轉(zhuǎn)換率等性能與電流消耗達(dá)到最佳平衡。圖中的所有放大器 OA0、OA1 及 OA2 均采用了高性能模式(快速模式)。
如欲了解有關(guān)運(yùn)算放大器使用的更多詳情,敬請(qǐng)參見(jiàn) MSP430FG4618/F2013 試驗(yàn)板用戶(hù)指南。
利用通用串行通信接口 (USCI) 可將音頻數(shù)據(jù)存儲(chǔ)到外部閃存中。我們也可通過(guò) I2C 總線(xiàn)或 SPI 總線(xiàn)與外部存儲(chǔ)器相連。
MSP430 性能
相關(guān)代碼文件中有一些 *.wav 文件示例,可表明解碼 ADPCM 數(shù)據(jù)的質(zhì)量。我們可在 PC 上用媒體播放器等軟件來(lái)比較這些文件,這樣就能體驗(yàn) ADPCM 壓縮算法的實(shí)際質(zhì)量了。請(qǐng)注意,通過(guò)提高音頻采樣率和音頻采樣大小(解析度),我們可以進(jìn)一步提高音頻質(zhì)量。
使用相關(guān)代碼
相關(guān)代碼中包含了兩個(gè)軟件項(xiàng)目,這兩個(gè)版本都基于第三部分中所介紹的內(nèi)容,也都采用 IMA ADPCM 算法。
ADPCM函數(shù)的使用非常簡(jiǎn)單。首先,必須在應(yīng)用代碼中包含ADPCM.h首標(biāo)文件。該首標(biāo)文件定義了ADPCM.c文件的ADPCM函數(shù)。在每次音頻數(shù)據(jù)的錄制或重放工作之前,必須調(diào)用 ADPCM_Init() 函數(shù)。該函數(shù)定義了信號(hào)估算(Se)的起始值以及用作量化器步長(zhǎng)調(diào)節(jié)的步長(zhǎng)指針。編碼器和解碼器通過(guò)設(shè)置可實(shí)現(xiàn)同步。調(diào)用ADPCM_Encoder(int value)函數(shù)就能進(jìn)行編碼,每個(gè)音頻采樣調(diào)用 ADPCM_Decoder() 函數(shù)就能進(jìn)行回放。以下代碼段顯示了如何完成上述工作。
#include "ADPCM.h"
void main(void)
{ // 應(yīng)用軟件初始化
while(1) // 主循環(huán)
{ // 應(yīng)用軟件
if (P1IN & 0x01)
record();
if (P1IN & 0x02)
play();
}
}
void record(void)
{ // 初始化后,以便 A/D 轉(zhuǎn)換器、定時(shí)器、放大器等的錄制
ADPCM_Init(); // 須在開(kāi)始錄制之前完成
// 開(kāi)始錄制
}
void play(void)
{ //初始化后,以便 A/D 轉(zhuǎn)換器、定時(shí)器、放大器等的錄制
ADPCM_Init(); //須在開(kāi)始錄制之前完成
// 開(kāi)始回放
}
接下來(lái),我們用 IAR Embedded Workbench KickStart version 3.42A 來(lái)測(cè)量 ADPCM 函數(shù)執(zhí)行的次數(shù)。測(cè)量時(shí),采用的是默認(rèn)優(yōu)化設(shè)置。
ADPCM_Encoder() 函數(shù)調(diào)用需要114~126個(gè)循環(huán)。
ADPCM_Decoder() 函數(shù)調(diào)用需要99~109個(gè)循環(huán)。
請(qǐng)注意,這只包含壓縮/解壓縮算法。要實(shí)現(xiàn)錄制和回放功能,還需要更多代碼。
參考文獻(xiàn):
1. MSP430x4xx 系列用戶(hù)指南 (SLAU056)
2. MSP430F169 產(chǎn)品說(shuō)明書(shū) (SLAS368)
3. MSP430FG4618 產(chǎn)品說(shuō)明書(shū) (SLAS508)
4. 基于 TMS32010 的 32kbps ADPCM (SPRA131)
5. 基于 MSP430F13x 的低成本 12 位語(yǔ)音編解碼器設(shè)計(jì) (SLAA131)
6. MSP430FG4618/F2013試驗(yàn)板用戶(hù)指南(SLAU213)
評(píng)論