arm 下C編程的非對齊訪問
閑話少說了,先貼一個測試的代碼,如果有arm開發(fā)板的同學可以拿到板子上跑一下,和在x86機器上跑出來的程序結(jié)果對比一下。
本文引用地址:http://cafeforensic.com/article/201611/317699.htm測試代碼
#include#include struct test{unsigned char a;unsigned char b;unsigned char sc;unsigned char sd;};struct test bbb;int main (int argc, char argv){char *tmp=(char *)&bbb;printf("sizeof(struct test)=%d n",sizeof(struct test));bbb.a = 0x01;bbb.b = 0x02;bbb.sc = 0x03;bbb.sd = 0x04;printf("bbb 0x%08x n",*(unsigned long *)tmp);printf("tmp %x= 0x%04x n",(int)tmp,*((unsigned short *)(tmp)));tmp+=1;printf("tmp+1 %x= 0x%04x n",(int)tmp,*((unsigned short *)(tmp))); tmp+=1;printf("tmp+2 %x= 0x%04x n",(int)tmp,*((unsigned short *)(tmp))); }
結(jié)果出乎意料(如果你不知道),竟然結(jié)果不同。
問題分析:
我們假設(shè)變量bbb在內(nèi)存中是這樣分布的
0x1000 | 0x01 |
0x1001 | 0x02 |
0x1002 | 0x03 |
0x1003 | 0x04 |
1、tmp開始的時候是指向0x1000的,取將tmp強制轉(zhuǎn)換為unsigned short 后輸出地值為0x0201,這個沒問題。
2、將tmp向后移動一位到0x1001后,取將tmp強制轉(zhuǎn)換為unsigned short 后輸出地值,這里,在x86和arm上跑的時候,就出現(xiàn)了不同的值了
在x86機器上跑出來的值是0x0302,這個是我們所期望的;但是在arm上這個值是0x0201。回去了?!
與其他RISC架構(gòu)一樣,ARM處理器能夠高效地訪問對齊的數(shù)據(jù),即字地址的末尾兩位為零,半字地址的最后一位為零,也稱這樣的數(shù)據(jù)位于它的自然大小邊界或者是自然對齊的。ARM編譯器希望普通的“C”指針指向一個4字節(jié)對齊內(nèi)存地址,這樣它可以在代碼中使用LDR/STR指令一次操作4個字節(jié),否則只能使用LDRB/LDRH等字節(jié)/半字操作指令。相反如果指針指向一個非自然對齊的地址,例如如果一個整型指針指向地址0x8006,當然希望裝載地址0x8006-0x8007-0x8008-0x8009處的數(shù)據(jù),但是實際上ARM會對非自然對齊的地址進行轉(zhuǎn)換而從裝載地址 0x8004-0x8005-0x8006-0x8007處的數(shù)據(jù)。
3、如果是long型的強制轉(zhuǎn)換,
long *tmp_long=(long *)tmp;
如果現(xiàn)在tmp指向的是0x1002,*tmp_long會是什么值呢?在x86下可能會出現(xiàn)段錯誤,因為內(nèi)存越界了,如果沒有的話,輸出應(yīng)該是0x00000403;
在arm下輸出的結(jié)果是0x02010304,這個我沒太想明白。我看網(wǎng)上有的說是循環(huán)移位的結(jié)果,這個循環(huán)移位以字節(jié)。如果是這個樣子的話,那么short類型為什么不是循環(huán)移位???想不明白啊。
總結(jié):
對于arm中的雙字節(jié)或者4字節(jié)數(shù)據(jù)的訪問,不能直接通過數(shù)據(jù)類型的強制轉(zhuǎn)換來實現(xiàn),必須通過單字節(jié)的方式:使用單字節(jié)賦值,或者memcpy等函數(shù),不過這樣做的時候,首先要先確定數(shù)據(jù)是大端還是小端模式。
例如上面的數(shù)據(jù),需要取出long型,可以這樣做
long tmp_long;memcpy(&tmp_long,tmp,4);
評論