采用可配置處理器技術(shù)構(gòu)建多發(fā)射向量DSP
DSP是進(jìn)行數(shù)字信號處理的絕好選擇,因?yàn)閿?shù)字信號處理器可以編程,并且在當(dāng)今數(shù)字媒體處理飛速變化的世界里可以容易地處理眾多變化的標(biāo)準(zhǔn)。然而,通用DSP的“通用性”使得其并非對所有應(yīng)用都能夠?qū)崿F(xiàn)很好的功耗效率(power-efficient)。
硬線連接的信號處理模塊通常有比較好的功耗效率,但是缺少DSP那樣的靈活性和可編程特性??膳渲锰幚砥骷夹g(shù)通過建立針對某一特定任務(wù)屬性正確的、功能豐富和可編程的DSP,在DSP的固定ISA(指令集體系結(jié)構(gòu))靈活性和可編程特性與硬線連接模塊的功耗有效性之間建立起橋梁。 Tensilica的Vectra LX是這種概念很好的詮釋。Vectra LX是一個(gè)定點(diǎn)的向量DSP引擎,該引擎是通過配置選項(xiàng)在Xtensa LX可配置處理器的基礎(chǔ)上建立起來的。
本文引用地址:http://cafeforensic.com/article/8017.htm
可配置架構(gòu)
Vectra LX定點(diǎn)DSP引擎是Xtensa LX微處理器內(nèi)核的一種配置。該定點(diǎn)DSP引擎是一個(gè)3發(fā)射的SIMD處理器,具有四個(gè)乘法器/累加器(四個(gè)MAC),它可以處理128位的向量。128位向量可以分成8個(gè)16位或者4個(gè)32位的元素。整個(gè)Vectra LX DSP引擎是用TIE(Tensilica’s Instruction Extension)語言開發(fā)的,通過修改可以適合目標(biāo)應(yīng)用領(lǐng)域。正像圖1所示,Vectra LX DSP引擎增加了16個(gè)向量寄存器(每個(gè)寄存器160位寬)、四個(gè)128位的向量隊(duì)列寄存器、第二個(gè)加載/存儲單元和210多條現(xiàn)有Xtensa LX處理器指令集體系結(jié)構(gòu)中的通用DSP指令。
基本的Xtensa LX處理器是一個(gè)單發(fā)射的微處理器,具有16位和24位指令。但是,Tensilica的處理器產(chǎn)生器(processor generator)能夠讓開發(fā)人員增加更寬的指令字長。通過一種稱為可變長度指令擴(kuò)展FLIX(Flexible-Length Instruction Extensions)的技術(shù)為處理器指令集增添多個(gè)獨(dú)立操作。FLIX指令寬度可以為32位或者64位,并且由于Xtensa LX處理器已經(jīng)設(shè)計(jì)成可以處理多種指令寬度,因此多操作FLIX指令可以在處理器代碼流中自由組合,并且可以和現(xiàn)有的單發(fā)射Xtensa LX處理器指令連接在一起。
當(dāng)開發(fā)人員選擇Vectra LX DSP引擎配置選項(xiàng)時(shí),Tensilica的處理器產(chǎn)生器會自動將DSP引擎的RTL代碼添加到可綜合的 Xtensa LX處理器中。新的Vectra LX指令被添加到處理器自動產(chǎn)生的軟件工具集(編譯器、匯編器、調(diào)試器、指令集仿真器ISS和實(shí)時(shí)操作系統(tǒng)RTOS接口)中。Vectra LX使得Xtensa LX處理器門數(shù)增加20萬~25萬門。這些增加的門數(shù)中的大部分用于構(gòu)建Vectra LX DSP引擎中的寄存器和執(zhí)行部件,因?yàn)橥ㄓ锰幚砥骱虳SP引擎擴(kuò)展可以共享處理器中現(xiàn)有的取指令和指令譯碼部件,所以那些硬件模塊不需要重新復(fù)制。然而,需要增加一些邏輯用于對新的指令進(jìn)行譯碼。圖2為Vectra LX DSP引擎配置選項(xiàng)中增加的寄存器和執(zhí)行部件框圖。
圖3表示三操作Vectra LX指令字格式。指令字中最右邊四位表示該指令寬度為64位。剩下的60位指令字長度不等地分布在三個(gè)操作指令槽中:一個(gè)24位和兩個(gè)18位的指令槽。Vectra LX指令字中的24位操作指令槽(指令字中第4位到第27位)可放置Xtensa LX處理器中所有80條基本指令,包括控制第一個(gè)加載/存儲單元的操作。該操作指令槽還可以處理擴(kuò)展的128位加載/存儲指令,此指令可將信息存到Vectra LX寬向量寄存器中,也可以從該向量寄存器讀出信息。
24位的操作指令槽能提供足夠?qū)挼木幋a位數(shù),允許加載和存儲指令在指令槽中指定對齊或者非對齊加載和存儲操作,如圖4所示。非對齊加載和存儲操作幫助相關(guān)的向量化編譯器處理存儲器數(shù)據(jù)陣列,這些數(shù)據(jù)陣列可以任意方式對齊,因?yàn)榫幾g器產(chǎn)生的代碼有時(shí)是非對齊的數(shù)據(jù)陣列,這將降低DSP的性能。然而,這種性能損失可以通過DSP引擎以非對齊加載和存儲操作方式提供的支持加以補(bǔ)償。
Vectra LX DSP引擎的對齊寄存器提供部分向量存儲功能,這些對齊寄存器在非對齊加載或者存儲字符串的開始用第一個(gè)部分向量進(jìn)行初始化。后續(xù)的非對齊加載或者存儲操作隱含地和新的向量數(shù)據(jù)進(jìn)行合并,這些向量數(shù)據(jù)經(jīng)過循環(huán)移位并和部分對齊寄存器內(nèi)容相連接,在對齊寄存器中將整個(gè)向量組合在一起。這些非對齊加載和存儲操作還為下一個(gè)非對齊加載或者存儲操作準(zhǔn)備好對齊寄存器,以便使得一系列連續(xù)的非對齊加載或者存儲操作能和對齊數(shù)據(jù)近似相同的效率將數(shù)據(jù)送入或者送出非對齊數(shù)據(jù)陣列。
Vectra LX DSP引擎采用第一個(gè)18位操作指令槽(第28位到第45位)來放置4
相關(guān)推薦
技術(shù)專區(qū)
- FPGA
- DSP
- MCU
- 示波器
- 步進(jìn)電機(jī)
- Zigbee
- LabVIEW
- Arduino
- RFID
- NFC
- STM32
- Protel
- GPS
- MSP430
- Multisim
- 濾波器
- CAN總線
- 開關(guān)電源
- 單片機(jī)
- PCB
- USB
- ARM
- CPLD
- 連接器
- MEMS
- CMOS
- MIPS
- EMC
- EDA
- ROM
- 陀螺儀
- VHDL
- 比較器
- Verilog
- 穩(wěn)壓電源
- RAM
- AVR
- 傳感器
- 可控硅
- IGBT
- 嵌入式開發(fā)
- 逆變器
- Quartus
- RS-232
- Cyclone
- 電位器
- 電機(jī)控制
- 藍(lán)牙
- PLC
- PWM
- 汽車電子
- 轉(zhuǎn)換器
- 電源管理
- 信號放大器
評論