色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

          新聞中心

          EEPW首頁 > 嵌入式系統(tǒng) > 設計應用 > 以可編程方式打造加密引擎

          以可編程方式打造加密引擎

          作者: 時間:2011-02-15 來源:網(wǎng)絡 收藏
          設計人員時常需要通過增加計算能力和/或額外輸入的方式來延長現(xiàn)有系統(tǒng)的壽命。在這方面,可編程系統(tǒng)平臺大有用武之地。我們曾經(jīng)希望采用安全網(wǎng)絡連接功能來升級一套網(wǎng)絡可編程系統(tǒng)。安全網(wǎng)絡連接功能需要加密才能運行安全外殼(SSH)、傳輸層安全(TLS)、安全套接層(SSL)或虛擬專用網(wǎng)(VPN)等協(xié)議。這種安全需求伴隨各種系統(tǒng)接入因特網(wǎng)的需求同步增長,例如,為了啟用遠程管理與分布式控制系統(tǒng)。因該領域仍在發(fā)展之中,而且標準尚未固定,因此成本主要取決于一次性工程費用。所以,采用FPGA技術能實現(xiàn)最高價值。

          我們的系統(tǒng)基于Missing Link Electronics(MLE)公司的“軟”硬件平臺,其FPGA具有靈活的I/O,能夠連接各種傳感器和執(zhí)行器。該平臺采用可編程邏輯實現(xiàn)片上系統(tǒng),以MicroBlaze CPU或PowerPC CPU作為其核心。CPU為操作系統(tǒng)與用戶空間應用軟件運行MLE Linux軟件棧。由于采用MicroBlaze或PowerPC作為主CPU,當運行Linux操作系統(tǒng)外加強大加密功能時,該系統(tǒng)顯然無法提供所需要的計算性能,而且也無法改變物理硬件。為了實現(xiàn)系統(tǒng)加速,我們使用可編程系統(tǒng)將計算從軟件域轉(zhuǎn)移到硬件側。

          協(xié)處理硬件

          可編程系統(tǒng)基本上是一個或幾個CPU(運行操作系統(tǒng)與應用軟件)的組合,外加一個FPGA。FPGA在其中用作靈活的接口“適配器”以及協(xié)處理硬件。我們可以在單獨輔助芯片上實現(xiàn)可編程系統(tǒng),或者將全部都集成到單個器件上。我們可以根據(jù)FPGA器件和CPU之間的通信方式,采用不同方法調(diào)節(jié)系統(tǒng)性能和功能。

          其中一種方法就是添加對等處理器,通過內(nèi)存映射狀態(tài)和控制寄存器與CPU實現(xiàn)同步。因為通過同一系統(tǒng)總線運行所有通信會很快降低性能,因此我們希望把CPU數(shù)據(jù)流與對等處理器分開。而采用賽靈思的Central DMA或多端口儲存器控制器(MPMC)等片上系統(tǒng)組件能夠輕松滿足上述愿望。

          另外,也可以增加一個協(xié)處理器,這種情況下能通過增加自定義指令(也叫編譯功能)有效地擴展CPU的指令集。例如,它適合浮點單元,而且賽靈思的結構協(xié)處理器模塊(FCM)技術能輕松支持上述功能。此處的優(yōu)勢是在CPU和協(xié)處理器之間使用一條從內(nèi)存到系統(tǒng)總線的專用通信通道。對于PowerPC,其為輔助處理單元(APU),而對于MicroBlaze,則是快速單工鏈路(FSL)。

          在加密和解密中,大部分運算按行或列執(zhí)行,剩下四項運算并行計算,硬件對此任務得心應手。

          AES:黃金標準

          但是沒有重大的系統(tǒng)重新設計,又該如何真正加速加密?對于加密,高級加密標準(AES)是一個事實標準。

          采用AES加密時,無法通過定義減少計算任務,從而使系統(tǒng)很快達到性能極限。如圖1所示,其中顯示用Valgrind分析工具、通過SCP(SSH會話)進行的文件傳輸?shù)姆治鼋Y果。此時AES加密占用三分之二計算任務。

          《電子系統(tǒng)設計》
          圖1:在采用Valgrind工具的SCP傳輸中,AES加密占用三分之二的計算任務。

          AES-128采用密鑰和128位塊大小,使用許多并發(fā)8字節(jié)運算。AES屬于分組密碼,基于按4x4字節(jié)陣列組織的固定分組大小運算。我們曾經(jīng)采用128位分組大小,它能抵擋所有已知攻擊,安全性甚至強于192位和256位版本。

          采用128位AES時,執(zhí)行加密與解密需要12個回合,每個回合需要幾步運算。第一項任務是通過所謂的密鑰擴展過程從密鑰中算出回合金鑰。每個回合都采用純文本自身的回合密鑰執(zhí)行純文本的逐位異或運算。然后進行字節(jié)代替、行位移和列混合運算,并再次執(zhí)行回合金鑰的異或運算。

          最后一個回合稍有不同,因為其中省略了一些步驟。加密過程采用所謂的S盒(其提供非線性)執(zhí)行替代。我們可以把它安置到一個16?16?8位矩陣中,從而能夠適應常見的賽靈思BRAM原語。多個S盒實例可以加速IP核,并在適當?shù)奈恢脼閮?nèi)核提供所需數(shù)據(jù),而無需等待對主存儲器的長時間總線存取。解密過程大同小異,其采用相同密鑰,但方向相反,并且使用不同S盒。

          增速12倍

          在加密和解密中,大部分運算按行或列執(zhí)行,剩下四項運算并行計算—而硬件對此任務得心應手。這樣就能夠通過不同來源實現(xiàn)AES硬件的各個部分。為了加速系統(tǒng),我們從龐大、快速增長的OpenCores.org資源庫(http://opencores.org/project,avs_aes)獲取AES內(nèi)核。

          我們刪除了原有的總線接口(因為它適用于另一種FPGA架構),另外為APU添加了一個接口,以便把AES內(nèi)核作為FCM協(xié)處理器連接到PowerPC上。我們共使用8個所謂的UDI指令在PowerPC和AESFCM之間傳輸數(shù)據(jù)。

          工作結果非常令人滿意(見圖2)。硬件加速的系統(tǒng)比原實現(xiàn)方案快了12倍。原來用以300MHz運行的獨立的PowerPC加密一個單塊需要17.8微秒,而采用以150MHz運行的AESFCM只需1.5微秒。如果只以升級到速度稍快的CPU來加速運算,我們采用硬件加速后的1.5微秒速度表現(xiàn)超過基于Intel Atom1.6GHz CPU的純軟件實現(xiàn)(其需要2.7微秒)。上述結果證明了使用FPGA技術的硬件加速的卓越潛能。

          《電子系統(tǒng)設計》
          圖2:硬件加速系統(tǒng)(中間綠條)快于獨立的PowerPC或Atom處理器。

          linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解(linux不再難懂)


          評論


          相關推薦

          技術專區(qū)

          關閉