TI 全新TMS320C66x 定點與浮點DSP內(nèi)核成功挑戰(zhàn)速度極限
圖 2 所示的 TI 最新 C66x 內(nèi)核具有同 C64x+ 內(nèi)核相同的基本 A B 結(jié)構(gòu)。請注意,.M 單元的 16 位乘法器已增至每個功能單元 16 個,從而實現(xiàn)內(nèi)核原始計算能力提升 4 倍。C66x DSP 實現(xiàn)的突破性創(chuàng)新使得由 4 個乘法器組成的各群集可協(xié)同工作以實施單精度浮點乘法運算。
圖 2 - TI 最新 C66x DSP 內(nèi)核
C66x DSP 內(nèi)核可同時運行多達(dá)八項浮點乘法運算,加之高達(dá) 1.25 GHz 的時鐘頻率,使其當(dāng)之無愧地成為市場上性能最高的浮點 DSP。將多個 C66x DSP 內(nèi)核進行完美整合,即可創(chuàng)建出具有出眾性能的多內(nèi)核片上系統(tǒng) (SoC) 設(shè)備。
浮點技術(shù)的成本為使定點與浮點組件都能同時實現(xiàn)最佳性能,TI 專為該款最新的 C66x 內(nèi)核開發(fā)了全新的浮點與定點指令,所有這些都對實現(xiàn)高效率的無線信號處理至關(guān)重要。由于采用浮點符號會帶來額外的計算復(fù)雜度,從而導(dǎo)致了定點與浮點處理器“分庭抗禮”的局面。在定點運算情況下,加法、乘法等基本操作簡單易行,但在浮點運算情況下,這些基本操作需要做更多工作量。比如兩個浮點數(shù)相乘的情形:
請注意,指數(shù)需要相加操作,尾數(shù)則需要相乘操作。然后,最終 (M1×M2) 值需調(diào)整成 23 位的表示形式,這可能需要對指數(shù)的值也作更改。使用浮點技術(shù)進行所有基本運算時將需要很多額外的操作。
浮點計算帶來的額外復(fù)雜度恰好說明了眾多算法僅采用定點表示數(shù)和定點運算的原因。嵌入式處理器能夠更快地運行定點運算,并且在眾多情況下,只需要定點算法即可。例如,C66x DSP 內(nèi)核在每個周期內(nèi)都能執(zhí)行 16 項定點乘法運算或者是 4 項浮點乘法運算。為使定點和浮點組件都能同時實現(xiàn)最佳性能,TI 為該款最新的 C66x DSP 內(nèi)核開發(fā)了定點與浮點運算指令,所有這些都對實現(xiàn)高效率的無線基站信號處理至關(guān)重要。浮點指令 FPi 包括:
1. 單精度復(fù)數(shù)乘法
2. 矢量乘法
3. 單精度矢量加減法
4. 單精度浮點-整數(shù)之間的矢量變換
5. 支持雙精度浮點算術(shù)運算(加、減、乘、除及與整數(shù)間的轉(zhuǎn)換)并且完全為管線式
最新定點指令可實現(xiàn)最佳的矢量信號處理 (VSPi),其中包括:
1. 復(fù)數(shù)矢量和矩陣乘法,諸如針對矢量的 DCMPY,以及針對矩陣乘法的CMATMPYR1
2. 實矢量乘法
3. 增強型點積計算
4. 矢量加減法
5. 矢量位移
6. 矢量比較
7. 矢量打包與拆包
評論