基于ARM平臺(tái)的嵌入式軟件保護(hù)方案
需要注意的是目前使用的很多嵌入式系統(tǒng)都是基于沒有特別設(shè)計(jì)安全機(jī)制的硬件平臺(tái)。本文以原ARM處理器平臺(tái)為例,通過增加1塊安全協(xié)處理器,就可以實(shí)現(xiàn)低成本、有實(shí)效的安全保護(hù),并且能夠抵御兩類比較寬泛的攻擊:一類是在系統(tǒng)的啟動(dòng)過程中的攻擊,如果系統(tǒng)啟動(dòng)過程中沒有安全保護(hù)措施,很可能被非法用戶使用非授權(quán)的軟件。另一類是外部存儲(chǔ)器及總線攻擊,當(dāng)程序代碼保存在外部非易失存儲(chǔ)器上時(shí),可以輕易被黑客拷貝。另外,片外存儲(chǔ)器與片上系統(tǒng)(SoC)之間的總線傳輸也容易受到攻擊。
1 硬件結(jié)構(gòu)
本方案的硬件結(jié)構(gòu)如圖1所示。處理器平臺(tái)采用三星公司的S3C2442,內(nèi)核為ARM920T,外置1塊2 MB的NorFlash用以存放密文數(shù)據(jù),ARM通過總線方式對(duì)NorFlash進(jìn)行訪問,該硬件結(jié)構(gòu)中最重要的部分是添加了1塊安全協(xié)處理器:福華公司的嵌入式系統(tǒng)軟件保護(hù)芯片F(xiàn)S8826。該芯片可通過I2C或SPI總線與SOC連接,這里使用I2C方式。PC機(jī)能夠?qū)τ布脚_(tái)中的每個(gè)芯片進(jìn)行編程控制:通過JTAG端口、串口及網(wǎng)口與ARM進(jìn)行通信,通過專門的燒錄器對(duì)FS8826的硬件密鑰和安全存儲(chǔ)區(qū)進(jìn)行寫入。本文引用地址:http://cafeforensic.com/article/152163.htm
2 軟件實(shí)現(xiàn)
軟件設(shè)計(jì)從兩個(gè)主要方面考慮,一是代碼加密,二是版權(quán)認(rèn)證。前者主要通過AES(Advanced Encryptiong Standard)加解密算法實(shí)現(xiàn),其算法密鑰的管理以及版權(quán)認(rèn)證將依靠FS8826來實(shí)現(xiàn),最終達(dá)到安全啟動(dòng)嵌入式操作系統(tǒng)以及保護(hù)運(yùn)行時(shí)的版權(quán)目的。安全啟動(dòng)方案基于Bootloader+Image的加載機(jī)制,也是ARM處理器通用的引導(dǎo)機(jī)制。首先采用AES加解密算法在PC機(jī)端將編譯完成Image加密,利用FS8826安全存儲(chǔ)區(qū)存放AES算法密鑰,密文存儲(chǔ)在片外存儲(chǔ)器中,ARM啟動(dòng)時(shí)將密文加載入內(nèi)存。然后在Bootloader啟動(dòng)過程時(shí)加入與FS8826的認(rèn)證操作,認(rèn)證通過則在該過程中使用AES解密算法解密Image,并用明文將原內(nèi)存中的密文覆蓋,系統(tǒng)正常運(yùn)行中加入與FS8826的實(shí)時(shí)通信監(jiān)測(cè),確保在授權(quán)目標(biāo)機(jī)上運(yùn)行程序。軟件實(shí)現(xiàn)流程如圖2所示,相應(yīng)的方案實(shí)現(xiàn)框圖如圖3所示。
2.1 AES算法
AES是美國國家標(biāo)準(zhǔn)和技術(shù)研究所(NIST)選定的高級(jí)加密標(biāo)準(zhǔn),是目前對(duì)稱加密領(lǐng)域內(nèi)的主流算法。其數(shù)據(jù)分組固定為128 bit,密鑰分組可支持128 bit/192 bit/256 bit。核心過程為數(shù)據(jù)塊矩陣的Nr(10/12/14)次輪操作。每一次輪操作都由S盒代換(SubBytes)、行移位(ShiftRows)、列混淆(MixColumns)和輪密鑰加(AddRoundKey)4個(gè)函數(shù)組成,第Nr次輪操作不包含MixColumns 函數(shù)。密鑰擴(kuò)展為每一輪變換提供輪密鑰[2]。本方案中加密在PC機(jī)端離線完成,沒有時(shí)間和運(yùn)行效率的特別要求,但是解密在ARM9處理器中完成,其運(yùn)行時(shí)間將作為系統(tǒng)啟動(dòng)的一部分,所以下面針對(duì)解密部分的算法程序結(jié)合其實(shí)現(xiàn)平臺(tái)進(jìn)行優(yōu)化設(shè)計(jì)。
直接的解密算法是將加密過程的每一步求逆并倒置次序得到,然而這樣并不利于優(yōu)化。算法的創(chuàng)始人提出了一種等價(jià)解密過程,在解密的輪變換中交換逆行移位和逆S盒代換,輪密鑰加和逆列混淆的順序,只需要調(diào)整密鑰的編排方案即可。在實(shí)現(xiàn)中等價(jià)解密過程可以將解密輪變換中的前3個(gè)步驟綜合生成1張4 KB的T表用于查詢,即可快速準(zhǔn)確地完成解密[2]。具體流程如圖4所示。
加解密過程使用電碼本模式(ECB)運(yùn)行,即將消息段逐個(gè)分別加解密。實(shí)現(xiàn)采用移植性較好的標(biāo)準(zhǔn)C編程。針對(duì)ARM處理器的特點(diǎn),C語言具有以下優(yōu)化的實(shí)現(xiàn)方式[3]:
(1) 數(shù)據(jù)類型設(shè)置:ARM處理器內(nèi)部是32 bit寄存器,如果變量長(zhǎng)度與ARM內(nèi)部寄存器長(zhǎng)度不一致,將會(huì)使得變量的存取都需要附加其他指令[3]。AES算法中密鑰及數(shù)據(jù)都是以字節(jié)為單位運(yùn)算,優(yōu)化時(shí)調(diào)整為32 bit,僅在輸入輸出時(shí)進(jìn)行位數(shù)變換,可以帶來很大的速度改進(jìn)。
(2) 循環(huán)展開:ARM處理器中每一次循環(huán)最少有4個(gè)周期的循環(huán)開銷[3]。解密輪變換涉及4個(gè)子函數(shù)調(diào)用,循環(huán)執(zhí)行Nr-1次。在等價(jià)解密算法融合了3個(gè)子函數(shù)形成T表查詢,于是可以把輪變換展開,在不增加太多代碼量的基礎(chǔ)上,每一個(gè)數(shù)據(jù)分組解密減少4(Nr-1)個(gè)周期。當(dāng)密鑰位長(zhǎng)、密文數(shù)據(jù)量大時(shí)節(jié)省的循環(huán)開銷就比較可觀。
評(píng)論