色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

          新聞中心

          EEPW首頁(yè) > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > SAM4E單片機(jī)之旅——24、使用DSP庫(kù)求向量數(shù)量積

          SAM4E單片機(jī)之旅——24、使用DSP庫(kù)求向量數(shù)量積

          作者: 時(shí)間:2017-05-08 來(lái)源:網(wǎng)絡(luò) 收藏

            DSP(Digital Signal Processing,數(shù)字信號(hào)處理)中會(huì)使用大量的數(shù)學(xué)運(yùn)算。Cortex-M4中,配置了一些強(qiáng)大的部件,以提高DSP能力。同時(shí)CMSIS提供了一個(gè)DSP庫(kù),提供了許多數(shù)學(xué)函數(shù)的高效實(shí)現(xiàn)。

          本文引用地址:http://cafeforensic.com/article/201705/358888.htm

            這次就先做一個(gè)簡(jiǎn)單的嘗試,求兩個(gè)向量的數(shù)量積。

            一、 硬件

              

          image

           

            MAC單元

            MAC(Multiply-ACcumulate,乘積累加),是DSP中常用的一種運(yùn)算。Cortex-M4配置了一個(gè)32位的MAC單元,它能在1個(gè)周期里實(shí)現(xiàn)最高難度為32位乘32位再加64位的運(yùn)算,或是兩個(gè)16位乘16位的運(yùn)算。Cortex-M4支持的MAC指令如下,這些指令都能在1個(gè)周期內(nèi)完成:

              

          image

           

            SIMD

            SIMD(Single Instruction Multiple Data,單指令多數(shù)據(jù)),可以提高DSP時(shí)的計(jì)算效率。這在Cortex-M3中不可用的。使用Cortex-M4的SIMD指令,可以在一個(gè)周期內(nèi)并行地完成4個(gè)8位數(shù)的加減,或是2個(gè)16位數(shù)的加減。

            FPU

            FPU是Cortex-M4增加的可選的部件(配備了FPU)。其實(shí)現(xiàn)了單精度的浮點(diǎn)數(shù)運(yùn)算,包括一些MAC運(yùn)算:

              

          image

           

            二、 使用CMSIS的DSP庫(kù)

            CMSIS中,提供了一個(gè)DSP庫(kù)。這里對(duì)DSP中常用的數(shù)學(xué)運(yùn)算做了很高效的實(shí)現(xiàn)。而對(duì)于Cortex-M4,其實(shí)現(xiàn)也針對(duì)SIMD進(jìn)行了優(yōu)化。

            在CMSISInclude文件夾中,頭文件arm_math.h 聲明了這些函數(shù)。而在CMSISLibGCC 中,有針對(duì)各平臺(tái)編譯好了的靜態(tài)庫(kù)文件。在CMSISDSP_LibSource 中,有DSP的實(shí)現(xiàn)源碼。

            而在使用arm_math.h 文件的過(guò)程中,需要根據(jù)目標(biāo)平臺(tái)預(yù)定義宏ARM_MATH_CM4,ARM_MATH_CM3 或ARM_MATH_CM0 。而若需要使用FPU,則需要在設(shè)備頭文件(如sam4e16e.h)中將宏__FPU_PRESENT 的值定義為1。

            在AS6中,默認(rèn)已經(jīng)添加了DSP的支持。

            進(jìn)入工程屬性的toolchain選項(xiàng)卡,可以在ARM/GNU C Complier的Directories中選擇編譯時(shí)搜索頭文件的路徑。AS6在建立工程時(shí),就會(huì)一些需要的頭文件拷貝到工程目錄下,同時(shí)做好了路徑設(shè)置。比如AS6已經(jīng)把a(bǔ)rm_math.h 拷貝到下圖中方框指出的路徑了:

              

          image

           

            在ARM/GNU Linker的Libraries選項(xiàng)中,可以選擇鏈接時(shí)使用的庫(kù)以及庫(kù)的路徑。同樣,AS6已經(jīng)把靜態(tài)庫(kù)文件拷貝到了工程目錄下,且設(shè)置好了文件:

              

          image

           

            在ARM/GNU C Complier的Symbols選項(xiàng)中,可以設(shè)置預(yù)定義的宏??梢栽谶@里聲明說(shuō)明DSP的目標(biāo)平臺(tái)的宏ARM_MATH_CM4:

              

          image

           

            在設(shè)備頭文件件中聲明__FPU_PRESENT 的值。如果有FPU,則將該宏定義為1,否則定義為0。CMSIS已經(jīng)做好了定義:

            //File: …srcASFsamutilscmsissam4eincludesam4e16e.h

            //Line: 266

            /**< 16E does provide a FPU */

            #define __FPU_PRESENT 1

            另外,如果不使用AS6提供的startup文件,或者需要在自己的代碼中使用FPU的話(huà),還需要做額外的設(shè)置。相關(guān)內(nèi)容在FPU的示例中做了說(shuō)明。

            三、 簡(jiǎn)單示例

            DSP庫(kù)里有計(jì)算向量數(shù)量積的函數(shù)。DSP庫(kù)的函數(shù)支持多種類(lèi)型的定點(diǎn)數(shù),且對(duì)于配備了FPU的部件,也支持浮點(diǎn)數(shù)。所以只需要簡(jiǎn)單地調(diào)用下所需函數(shù)即可:

            // 向量為(0.0, 1.1, 2.2, ..., 16.5)

            const int VEC_SIZE = 16;

            float32_t vec[VEC_SIZE];

            for (int i = 0; i < VEC_SIZE; ++i)

            vec[i] = 1.1f * i;

            // 計(jì)算向量與自身的數(shù)量積

            float32_t result = 0;

            arm_dot_prod_f32(vec, vec, VEC_SIZE, &result);

            // result == 1500.4

            查看arm_dot_prod_f32() 的實(shí)現(xiàn),發(fā)現(xiàn)其已經(jīng)為了效率進(jìn)行了循環(huán)展開(kāi)。而查看另外一些有關(guān)定點(diǎn)數(shù)的運(yùn)算,可以發(fā)現(xiàn)其實(shí)現(xiàn)已經(jīng)使用了SIMD等特殊指令;有些甚至針對(duì)內(nèi)存訪問(wèn)的延遲進(jìn)行了優(yōu)化。不難看出,這個(gè)庫(kù)的實(shí)現(xiàn)進(jìn)行了細(xì)致優(yōu)化的。

            另外,除了基本的數(shù)學(xué)函數(shù),DSP庫(kù)也實(shí)現(xiàn)了快速數(shù)學(xué)函數(shù)(三角函數(shù)、開(kāi)平方等)、實(shí)數(shù)相關(guān)、矩陣運(yùn)算、統(tǒng)計(jì)、濾波、變換(FFT等)、馬達(dá)控制等功能。arm_math.h 中,已經(jīng)對(duì)各個(gè)函數(shù)的功能、參數(shù)意義等做了詳細(xì)的說(shuō)明。



          關(guān)鍵詞: SAM4E

          評(píng)論


          技術(shù)專(zhuān)區(qū)

          關(guān)閉