STM32學(xué)前班教程之一:為什么選擇STM32?
--------首先聲明一下:該教程由思蛻盟論壇原創(chuàng),本人一是為了自己學(xué)習(xí),自我感覺(jué)此對(duì)stm32入門很有幫助,二是為了給更多的初學(xué)者帶來(lái)方便,所以決定轉(zhuǎn)載。轉(zhuǎn)載中糾正其中的部分錯(cuò)誤,盡量加入最新的信息,并增加本人的部分見(jiàn)解和學(xué)習(xí)的感受,希望對(duì)閱讀者帶來(lái)點(diǎn)點(diǎn)閱讀價(jià)值!真誠(chéng)歡迎讀者提出疑問(wèn),而后共同交流,共同進(jìn)步!
本文引用地址:http://cafeforensic.com/article/201611/322408.htm我對(duì)未來(lái)的規(guī)劃是以功能性為主的,在功能和面積之間做以平衡是我的首要選擇,而把運(yùn)算放在第二位,這根我的專業(yè)有關(guān)系。里面的運(yùn)算其實(shí)并不復(fù)雜,在入門階段想盡量減少所接觸的東西。
不過(guò)說(shuō)實(shí)話,對(duì)DSP的外設(shè)并和開發(fā)環(huán)境不滿意,這是為什么STM32一出就轉(zhuǎn)向的原因。下面是我自己做過(guò)的兩塊DSP28的全功能最小系統(tǒng)板,在做這兩塊板子的過(guò)程中發(fā)現(xiàn)要想盡力縮小DSP的面積實(shí)在不容易(目前只能達(dá)到50mm×45mm,這還是沒(méi)有其他器件的情況下),尤其是雙電源的供電方式和1.9V的電源讓人很頭疼。
后來(lái)因?yàn)橐粋€(gè)項(xiàng)目,接觸了LPC2148并做了一塊板子,發(fā)現(xiàn)小型的ARM7在外設(shè)夠用的情況下其實(shí)很不錯(cuò),于是開始搜集相關(guān)芯片資料,也同時(shí)對(duì)小面積的AVR和51都進(jìn)行了大致的比較,這個(gè)時(shí)候發(fā)現(xiàn)了CortexM3的STM32,比2148擁有更豐富和靈活的外設(shè),性能幾乎是2148兩倍(按照MIPS值計(jì)算)。正好2148我還沒(méi)上手,就直接轉(zhuǎn)了這款STM32F103。
與2811相比較(核心1.8V供電情況下),135MHz×1MIPS?,F(xiàn)在用STM32F103,72MHz×1.25MIPS,性能是DSP的66%,STM32F103R型(64管腳)芯片面積只有2811的51%,STM32F103C型(48管腳)面積是2811的25%,最大功耗是DSP的20%,單片價(jià)格是DSP的30%。且有更多的串口,CAP和PWM,這是有用的。高端型號(hào)有SDIO,理論上比SPI速度快。
ARM Cortex-M3相比于ARM其他系列微控制器,具有以下優(yōu)勢(shì)或特點(diǎn):
1.三級(jí)流水線+分支預(yù)測(cè)
現(xiàn)代處理器大多采用指令預(yù)取和流水線技術(shù),以提高處理器的指令執(zhí)行速度。流水線處理器在正常執(zhí)行指令時(shí),如果碰到分支(跳轉(zhuǎn))指令,由于指令執(zhí)行的順序可能會(huì)發(fā)生變化,指令預(yù)取隊(duì)列和流水線中的部分指令就可能作廢,而需要從新的地址重新取指、執(zhí)行,這樣就會(huì)使流水線“斷流”,處理器性能因此而受到影響。特別是現(xiàn)代C語(yǔ)言程序,經(jīng)編譯器優(yōu)化生成的目標(biāo)代碼中,分支指令所占的比例可達(dá)10-20%,對(duì)流水線處理器的影響會(huì)的更大。為此,現(xiàn)代高性能流水線處理器中一般都加入了分支預(yù)測(cè)部件,就是在處理器從存儲(chǔ)器預(yù)取指令時(shí),當(dāng)遇到分支(跳轉(zhuǎn))指令時(shí),能自動(dòng)預(yù)測(cè)跳轉(zhuǎn)是否會(huì)發(fā)生,再?gòu)念A(yù)測(cè)的方向進(jìn)行取指,從而提供給流水線連續(xù)的指令流,流水線就可以不斷地執(zhí)行有效指令,保證了其性能的發(fā)揮。
ARM Cortex-M3內(nèi)核的預(yù)取部件具有分支預(yù)測(cè)功能,可以預(yù)取分支目標(biāo)地址的指令,使分支延遲減少到一個(gè)時(shí)鐘周期。
2.哈佛結(jié)構(gòu)
從內(nèi)核訪問(wèn)指令和數(shù)據(jù)的不同空間與總線結(jié)構(gòu),可以把處理器分為哈佛結(jié)構(gòu)和普林斯頓結(jié)構(gòu)(或馮.諾伊曼結(jié)構(gòu))。馮.諾伊曼結(jié)構(gòu)的機(jī)器指令、數(shù)據(jù)和I/O共用一條總線,這樣內(nèi)核在取指時(shí)就不能進(jìn)行數(shù)據(jù)讀寫,反之亦然。這在傳統(tǒng)的非流水線處理器(如MCS51)上是沒(méi)有什么問(wèn)題的,它們?nèi)≈浮?zhí)行分時(shí)進(jìn)行,不會(huì)發(fā)生沖突。但在現(xiàn)代流水線處理器上,由于取指、譯碼和執(zhí)行是同時(shí)進(jìn)行的(不是同一條指令),一條總線就會(huì)發(fā)生總線沖突,必須插入延遲等待,從而影響了系統(tǒng)性能。ARM7TDMI內(nèi)核就是這種結(jié)構(gòu)的。
而哈佛結(jié)構(gòu)的處理器采用獨(dú)立的指令總線和數(shù)據(jù)總線,可以同時(shí)進(jìn)行取指和數(shù)據(jù)讀寫操作,從而提高了處理器的運(yùn)行性能。ARM Cortex-M3、ARM966E、ARM926EJ、ARM1136JF等內(nèi)核都采用了哈佛結(jié)構(gòu)。
3.內(nèi)置嵌套向量中斷控制器(NVIC)
針對(duì)業(yè)界對(duì)ARM處理器中斷響應(yīng)的問(wèn)題,Cortex-M3首次在內(nèi)核上集成了嵌套向量中斷控制器(NVIC)。Cortex-M3的中斷延遲只有12個(gè)時(shí)鐘周期(ARM7需要24-42個(gè)周期);Cortex-M3還使用尾鏈技術(shù),使得背靠背(back-to-back)中斷的響應(yīng)只需要6個(gè)時(shí)鐘周期(ARM7需要大于30個(gè)周期)。以STM32運(yùn)行在75MHz為例,中斷延遲只有80ns-160ns。另外,Cortex-M3采用了基于棧的異常模式,使得芯片初始化的封裝更為簡(jiǎn)單。
ARM7TDMI內(nèi)核不帶中斷控制器,具體MCU的中斷控制器是各芯片廠商自己加入的,這使得各廠商的ARM7 MCU中斷控制部分都不一樣,給用戶使用及程序移植帶來(lái)了很大麻煩。Cortex-M3內(nèi)核集成NVIC,各廠商生產(chǎn)的基于Cortex-M3內(nèi)核的MCU都具有統(tǒng)一的中斷控制器,對(duì)用戶使用各種Cortex-M3 MCU,特別是中斷編程帶來(lái)了很大的便利。
4.支持位綁定操作
以前的ARM內(nèi)核不支持位操作,當(dāng)需要對(duì)一個(gè)變量或端口的某一位操作時(shí),先要用邏輯與/或指令屏蔽其他的位,使位操作需要較多的指令和時(shí)鐘周期。ARM
Cortex-M3采用了一種特殊的方法——位綁定:把一個(gè)地址單元的32位變量中的每一位,通過(guò)一個(gè)簡(jiǎn)單的地址轉(zhuǎn)換算法,映射到另一個(gè)地址空間,每一位占用一個(gè)地址,對(duì)此地址空間的操作,只有數(shù)據(jù)的最低一位是有效的,其余高31位的值被忽略。相當(dāng)于把一個(gè)“橫”的32位字給“豎”起來(lái)。這樣對(duì)新的映射空間操作時(shí),就可以不用屏蔽操作,優(yōu)化了RAM和I/O寄存器的讀寫,提高了位操作的速度。
這種方法粗看起來(lái)好像損失了很多地址空間,其實(shí)對(duì)于32位的ARM處理器而言,總共可以尋址4GB的空間,而對(duì)于一個(gè)MCU來(lái)說(shuō),一般只用到幾百KB的空間。所以這種處理方法絲毫不會(huì)影響一個(gè)MCU的正常使用,又大大簡(jiǎn)化了處理器的設(shè)計(jì),可以說(shuō)是一種良策。
5.支持串行調(diào)試(SWD)
ARM處理器一般都使用JTAG調(diào)試接口,使得仿真、調(diào)試工具統(tǒng)一而廉價(jià),方便了用戶開發(fā)。但JTAG調(diào)試接口至少要占用芯片的5-6個(gè)引腳,這對(duì)于一些引腳較少的MCU來(lái)說(shuō),有時(shí)會(huì)對(duì)仿真調(diào)試和I/O使用帶來(lái)麻煩。
ARM
Cortex-M3在保持原來(lái)JTAG調(diào)試接口的基礎(chǔ)上,還支持串行調(diào)試(SWD)。使用SWD時(shí),只占用2個(gè)引腳,就可以進(jìn)行所有的仿真和調(diào)試,節(jié)省了調(diào)試用引腳,用戶就可以使用更多的引腳。
另外,Cortex-M3支持8個(gè)硬件斷點(diǎn)(ARM7、ARM9只支持2個(gè)硬件斷點(diǎn)),可以減少斷點(diǎn)調(diào)試時(shí)對(duì)代碼的影響,保證仿真、調(diào)試的時(shí)序準(zhǔn)確性。
6.內(nèi)核支持低功耗模式
ARM內(nèi)核已經(jīng)是一個(gè)高性能、低功耗的內(nèi)核,但ARM7、ARM9等內(nèi)核本身只有運(yùn)行/停止模式,沒(méi)有其他模式。各芯片廠商只能在內(nèi)核基礎(chǔ)上,對(duì)各自加入的外設(shè)定義各種低功耗模式。Cortex-M3加入了類似于8位處理器的內(nèi)核低功耗模式,支持3種功耗管理模式:通過(guò)一條指令立即睡眠;異常/中斷退出時(shí)睡眠;深度睡眠。使整個(gè)芯片的功耗控制更為有效。以STM32為例,其RAM和寄存器狀態(tài)保持的停機(jī)模式耗電僅為14uA,從此狀態(tài)的啟動(dòng)時(shí)間僅為7us。
Cortex-M3的運(yùn)行功耗(Active Mode)也很低。以STM32系列微控制器為例,其典型功耗約為500uA/MHz,也只是目前業(yè)界超低功耗單片機(jī)MSP430系列(約為250uA/MHz)的2倍。但MSP430是16位處理器,而STM32是32位處理器。
7.高效的Thumb2 16/32位混合指令集
ARM7、ARM9等內(nèi)核使用不同的處理器狀態(tài)分別執(zhí)行32位的ARM指令和16位的Thumb指令,使用狀態(tài)切換指令完成ARM狀態(tài)和Thumb狀態(tài)的切換。Cortex-M3使用更高效的Thumb2指令集,它是一種16/32位混合編碼指令,兼容Thumb指令。對(duì)于一個(gè)應(yīng)用程序編譯生成的Thumb2代碼,以接近Thumb編碼的代碼尺寸,達(dá)到了接近ARM編碼的運(yùn)行性能。Thumb2是一種緊湊、高效的新一代指令集。
Thumb2指令集是面向高級(jí)語(yǔ)言的指令集,適合于C語(yǔ)言編程,由編譯器生成目標(biāo)代碼,不建議直接使用Thumb2匯編語(yǔ)言編程。
8. 32位硬件除法和單周期乘法
以往的ARM處理器沒(méi)有除法指令,在某些除法密集型應(yīng)用中性能不盡如意。Cortex-M3加入了32位除法指令,彌補(bǔ)了這一缺陷,使Cortex-M3可以和其他通用處理器一樣,完成各種數(shù)學(xué)運(yùn)算操作。
Cortex-M3還改進(jìn)了乘法運(yùn)算部件,32結(jié)果的32位x32位乘法操作只要一個(gè)時(shí)鐘周期。這一性能使得使用Cortex-M3來(lái)進(jìn)行乘、乘加運(yùn)算時(shí),已逼近DSP的性能,因此特別適合一些需要簡(jiǎn)單DSP的應(yīng)用領(lǐng)域,如電機(jī)控制、數(shù)字濾波、FFT變換等。
需要指出的是,32位的乘/除運(yùn)算,對(duì)于一個(gè)8位機(jī)而言,已經(jīng)是一段比較復(fù)雜的程序,而對(duì)于32位的Cortex-M3而言,只需一句指令。因此,即使二者工作主頻一樣,實(shí)際運(yùn)行性能也不是一個(gè)數(shù)量級(jí)的。
評(píng)論