色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

          新聞中心

          EEPW首頁(yè) > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > ARM開(kāi)發(fā)各種燒寫文件格式說(shuō)明(ELF、HEX、BIN)

          ARM開(kāi)發(fā)各種燒寫文件格式說(shuō)明(ELF、HEX、BIN)

          作者: 時(shí)間:2016-11-11 來(lái)源:網(wǎng)絡(luò) 收藏
          一、ELF


          Executable and linking format(ELF)文件是x86Linux系統(tǒng)下的一種常用目標(biāo)文件(object file)格式,有三種主要類型:
          (1)適于連接的可重定位文件(relocatable file),可與其它目標(biāo)文件一起創(chuàng)建可執(zhí)行文件和共享目標(biāo)文件。
          (2)適于執(zhí)行的可執(zhí)行文件(executable file),用于提供程序的進(jìn)程映像,加載的內(nèi)存執(zhí)行。
          (3)共享目標(biāo)文件(shared object file),連接器可將它與其它可重定位文件和共享目標(biāo)文件連接成其它的目標(biāo)文件,動(dòng)態(tài)連接器又可將它與可執(zhí)行文件和其它共享目標(biāo)文件結(jié)合起來(lái)創(chuàng)建一個(gè)進(jìn)程映像。
          ELF文件格式比較復(fù)雜。

          二、HEX

          Intel HEX文件是記錄文本行的ASCII文本文件,在Intel HEX文件中,每一行是一個(gè)HEX記錄,由十六進(jìn)制數(shù)組成的機(jī)器碼或者數(shù)據(jù)常量,Intel HEX文件經(jīng)常被用于將程序或數(shù)據(jù)傳輸
          存儲(chǔ)到ROM、EPROM,大多數(shù)編程器和模擬器使用Intel HEX文件。
          記錄格式
          一個(gè)Intel HEX文件可以包含任意多的十六進(jìn)制記錄,每條記錄有五個(gè)域,下面是一個(gè)記錄的格式。
          : llaaaatt[dd。。。]cc
          每一組字母是獨(dú)立的一域,每一個(gè)字母是一個(gè)十六進(jìn)制數(shù)字,每一域至少由兩個(gè)十六進(jìn)制數(shù)字組成,下面是字節(jié)的描述。
          : 冒號(hào) 是每一條Intel HEX記錄的開(kāi)始
          ll 是這條記錄的長(zhǎng)度域,他表示數(shù)據(jù)(dd)的字節(jié)數(shù)目。
          aaaa 是地址域,他表示數(shù)據(jù)的起始地址
          tt 這個(gè)域表示這條HEX記錄的類型,他有可能是下面這幾種類型
          00 —-數(shù)據(jù)記錄
          01 —-文件結(jié)束記錄
          02 —-擴(kuò)展段地址記錄
          04 —-擴(kuò)展線性地址記錄
          dd 是數(shù)據(jù)域,表示一個(gè)字節(jié)的數(shù)據(jù),一個(gè)記錄可能有多個(gè)數(shù)據(jù)字節(jié),字節(jié)數(shù)目可以
          查看ll域的說(shuō)明
          cc 是效驗(yàn)和域,表示記錄的效驗(yàn)和,計(jì)算方法是將本條記錄冒號(hào)開(kāi)始的所有字母對(duì)
          所表示的十六進(jìn)制數(shù)字
          都加起來(lái)然后模除256得到的余數(shù)最后求出余數(shù)的補(bǔ)碼即是本效驗(yàn)字節(jié)cc。
          : 0300000002005E9D
          cc=0×01+NOT((0×03+0×00+0×00+0×00+0×02+0×00+0×5E)%0×100)=0×01+0×9C=0×9D >
          數(shù)據(jù)記錄
          Intel HEX文件由若干個(gè)數(shù)據(jù)記錄組成,一個(gè)數(shù)據(jù)記錄以一個(gè)回車和一個(gè)換行結(jié)束
          比如下面的一條數(shù)據(jù)記錄
          : 10246200464C5549442050524F46494C4500464C33
          10 是此行記錄數(shù)據(jù)的字節(jié)數(shù)目
          2462 是數(shù)據(jù)在內(nèi)存中的起始地址
          00 是記錄類型00(是一個(gè)數(shù)據(jù)記錄)
          464C 到 464C 是數(shù)據(jù)
          33 是此行記錄的效驗(yàn)和

          三、BIN

          BIN文件就是直接的二進(jìn)制文件,內(nèi)部沒(méi)有地址標(biāo)記。一般用編程器燒寫時(shí)從00開(kāi)始,而如果下載運(yùn)行,則下載到編譯時(shí)的地址即可。

          總結(jié):可以由ELF文件轉(zhuǎn)化為其它兩種文件,HEX也可以直接轉(zhuǎn)換為BIN文件,但是BIN要轉(zhuǎn)化為HEX文件必須要給定一個(gè)基地址。而HEX和BIN不能轉(zhuǎn)化為elf文件,因?yàn)镋LF的信息量要大。另外還有一種ads的調(diào)試文件axf,
          它可以轉(zhuǎn)化為BIN文件,用以下命令 fromelf -nodebug xx。axf -bin xx。bin即可。

          本文引用地址:http://cafeforensic.com/article/201611/316997.htm



          這里所說(shuō)的ARM系統(tǒng)基本文件格式,都是在基于ARM的嵌入式系統(tǒng)開(kāi)發(fā)中常會(huì)碰到的文件格式。
          ARM系統(tǒng)基本文件格式有三種:
          1)BIN,平板式二進(jìn)制格式,一般用于直接燒寫到Flash中,也可以用于加載到monitor程序中。
          2)ELF,EXECUTABLEANDLINKABLEFORMAT,一種通用的OBJECT文件格式,一般由GNUCOMPILERCOLLECTION(GCC)產(chǎn)生。
          3)AXF,BIN格式的擴(kuò)展版,主體部分同BIN,在文件頭和尾加入了調(diào)試用的信息,用于AXD。
          本文主要討論BIN與ELF。
          首先說(shuō)明,ELF格式是一種OBJECT文件格式。一般OBJECT文件都可以分成三類:可重定位OBJECT文件,可執(zhí)行OBJECT文件,共享OBJECT文件。ELF格式文件也可以分成這三種。
          首先說(shuō)說(shuō)可重定位OBJECT文件。這種OBJECT文件一般由GCC中的ASSEMBLER(as)產(chǎn)生(請(qǐng)不要認(rèn)為GCC只是編譯器),里面除了二進(jìn)制的機(jī)器代碼,還有一些可用于進(jìn)行重定位的信息。它主要是作為L(zhǎng)INKER(ld)的輸入,LINKER將跟據(jù)這些信息,將需要重定位的符號(hào)重定位,進(jìn)而產(chǎn)生可執(zhí)行的OBJECT文件。ELF格式的可重定位OBJECT文件由header與section組成。
          Header包括ELFheader與sectionheader.ELFheader位于文件的頭部,用于存儲(chǔ)目標(biāo)機(jī)器的架構(gòu),大小端配置,ELFheader大小,object文件類型,sectionheader在文件中的偏移,sectionheader的大小,sectionheader中的項(xiàng)目數(shù)等信息。Sectionheader則定義了文件中每個(gè)section的類型,位置,大小等信息。Linker就是通過(guò)查找ELFheader,找到sectionheader的入口,再在sectionheader中找到相應(yīng)的section入口,進(jìn)而定位到目標(biāo)section的。
          Section包括
          .text:經(jīng)過(guò)編譯的機(jī)器代碼。
          .rodata:只讀的數(shù)據(jù),例如printf(“hello!”)中的字符串hello。
          .data:已初始化的全局變量,局部變量將在運(yùn)行時(shí)被存放在堆棧中,不會(huì)在.data或.bss段中出現(xiàn)。
          .bss:未初始化的全局變量,在這里只是一個(gè)占位符,在object文件中并沒(méi)有實(shí)際的存儲(chǔ)空間。
          .symtab:符號(hào)表,用于存放程序中被定義的或被引用到的全局變量和函數(shù)的信息。
          .rel.text:一個(gè)保存著一系列在.text中的位置的列表。這些位置將在linker把這個(gè)文件與其它object文件合并時(shí)被修改,一般來(lái)說(shuō),這些位置都是保存著一些引用到全局變量或者外部函數(shù)的指令。引用局部變量或者本地函數(shù)的指令是不需要被修改的,因?yàn)榫植孔兞亢捅镜睾瘮?shù)的地址一般都是使用PC相對(duì)偏移地址的。需要注意的是,這個(gè)section和下面的.rel.data在運(yùn)行時(shí)并不需要,生成可執(zhí)行的ELFobject文件時(shí)會(huì)去掉這個(gè)section。
          .rel.data:保存全局變量的重定位信息。一般來(lái)說(shuō),如果一個(gè)全局變量它的初始化值是另一個(gè)全局變量的地址,或者是外部函數(shù)的地址,那么它就需要被重定位。
          .debug:保存debug信息。
          .strtab:一個(gè)字符串表,保存著.symtab和.debug,和各個(gè)section的名字。.symtab,.debug和sectiontable里面,凡是保存name的域,其實(shí)都是保存了一個(gè)偏移值,通過(guò)這個(gè)偏移值在這個(gè)字符串表里面可以找到相應(yīng)得字符串。
          下面仔細(xì)討論一下.symtab:
          每一個(gè)可重定位的object文件,都會(huì)有一個(gè).symtab。這個(gè)符號(hào)表保存了在這個(gè)object文件中所有被定義的和被引用的符號(hào)。當(dāng)源程序是C語(yǔ)言程序時(shí),.symtab中的符號(hào)直接來(lái)源于C編譯器(cc1)。這里所說(shuō)的符號(hào)主要有三種:
          1)在這個(gè)object文件中被定義的可以被其他object文件全局符號(hào)。在C語(yǔ)言源程序中,主要就是那些非靜態(tài)(沒(méi)有static修飾的)的全局變量和非靜態(tài)的函數(shù)。在ARM匯編語(yǔ)言中,就是那些被EXPORT指令導(dǎo)出的變量。
          2)在這個(gè)object文件中引用到,但是在其他文件中定義的全局變量。在ARM匯編語(yǔ)言中就是通過(guò)IMPORT命令引入的變量
          3)本地變量。本地變量只在本object文件內(nèi)可見(jiàn)。這里的本地變量指的是連接器本地變量,應(yīng)該和一般的程序本地變量作區(qū)別。這里所指的本地變量,包括用static修飾的全局變量,object文件中section名稱,源代碼文件名稱。一般意義上的本地變量,是在運(yùn)行時(shí)由系統(tǒng)的運(yùn)行時(shí)環(huán)境管理的,linker并不關(guān)心。
          每個(gè)符合上面條件的符號(hào)在.symtab文件中都會(huì)有一個(gè)數(shù)據(jù)項(xiàng)。這個(gè)數(shù)據(jù)項(xiàng)的數(shù)據(jù)結(jié)構(gòu)是:

          Typedefstruct{
          intname;//符號(hào)名稱,其實(shí)就是.strtab的偏移值
          intvalue;//在section中的位置,以相對(duì)section地址的偏移表示
          intsize;//大小
          chartype;//類型,一般是數(shù)據(jù)或函數(shù)
          charbinding;//是本地變量還是全局變量
          charreserved;//保留的位
          charsection;//符號(hào)所屬的section。可選有:.text(用數(shù)字1代表),.data(用數(shù)
          //3代表),ABS(不應(yīng)被重定位的符號(hào)),UND(在本object文件
          //中未定義的符號(hào),可能在別的文件中定義),COM(一般的未初//始化的變量符號(hào))。
          }ELF_sym

          現(xiàn)在假設(shè)組成應(yīng)用的各個(gè)模塊都已經(jīng)被匯編,構(gòu)建出了可重定位的object文件。這些object的結(jié)構(gòu)都是一樣的,有各自的.text,.datasection,有各自的.symtab.GCC下一步要做的就是使用linker(ld),把這些object文件,加上必要的庫(kù)連接成具有絕對(duì)運(yùn)行時(shí)地址的可執(zhí)行文件,就是可執(zhí)行的ELF格式的文件。
          Linker的連接動(dòng)作可以分為兩部分:
          1)符號(hào)解析。確定引用符號(hào)的指向。
          2)符號(hào)重定位。合并section,分配運(yùn)行時(shí)環(huán)境地址,引用符號(hào)重定位。
          符號(hào)解析:
          在一個(gè)object文件中,有指令定義了符號(hào),也有指令引用了符號(hào)??赡艽嬖谶@樣一種情況,一個(gè)被引用到的符號(hào),有多重的定義。符號(hào)解析的作用就是確定,在這個(gè)object文件中,一個(gè)符號(hào)引用真正引用的是哪個(gè)符號(hào)。
          在編譯的時(shí)候,除了在本文件中定義的全局變量會(huì)由編譯器生成一個(gè)符號(hào)表項(xiàng)之外,當(dāng)發(fā)現(xiàn)一個(gè)被引用到的符號(hào)在本文件中并沒(méi)有被定義,編譯器也會(huì)自動(dòng)產(chǎn)生一個(gè)符號(hào)表項(xiàng),把確定這些引用的工作留給linker。匯編器在匯編時(shí)將讀取這些符號(hào)表項(xiàng),生成.symtab。在讀取的過(guò)程中,如果發(fā)現(xiàn)有在無(wú)法確定的符號(hào)引用項(xiàng),匯編器會(huì)為這些符號(hào)額外生成一個(gè)數(shù)據(jù)項(xiàng),稱作重定位數(shù)據(jù)項(xiàng),存放于rel.text或rel.datasection中,交由linker確定。下面是重定位數(shù)據(jù)項(xiàng)(relocationentry)的數(shù)據(jù)結(jié)構(gòu):

          Typedefstruct{
          intoffset;//指明需要被重定位的引用在object中的偏移,實(shí)際上就是需要被重定位的引用
          //在object中的實(shí)際位置
          intsymbol;//這個(gè)被重定位的引用真實(shí)指向的符號(hào)
          inttype;//重定位類型:R_ARM_PC24:使用24bit的PC相對(duì)地址重定位引用
          //R_ARM_ABS32:使用32bit絕對(duì)地址重定位引用
          }Elf32_Rel

          Linker需要解析的,就是那些被生成了重定位數(shù)據(jù)項(xiàng)的引用。Linker將根據(jù)C語(yǔ)言定義的規(guī)則,對(duì)于每一個(gè)重定位數(shù)據(jù)項(xiàng),在輸入的各個(gè)object文件中查找適合的符號(hào),把這個(gè)符號(hào)填入symbol項(xiàng)中。但是由于還不知道這個(gè)符號(hào)的真實(shí)地址,所以現(xiàn)在就算知道了引用的真實(shí)指向,但我們還是不能確定這個(gè)引用指向的地址。
          符號(hào)重定位:
          符號(hào)重定位用來(lái)解決上面的問(wèn)題。Linker首先進(jìn)行section的合并。Linker合并object文件的過(guò)程很簡(jiǎn)單,一般就是相同屬性的section合并,例如不同object文件的.textsection將被合并成一個(gè).text。同樣,.symtabsection也被合并成一個(gè).symtab。這里面涉及到兩個(gè)問(wèn)題:
          1)各個(gè)object文件合并的順序。這個(gè)問(wèn)題涉及到最終指令和符號(hào)的運(yùn)行地址。最為重要的是,究竟是哪個(gè)section排在最前頭?在ARMRAW系統(tǒng)得開(kāi)發(fā)過(guò)程中,這個(gè)最為重要。ARM系統(tǒng)CPU上電后,系統(tǒng)會(huì)自動(dòng)的從0x00000000地址取指令并執(zhí)行,這個(gè)地址上映射著存儲(chǔ)器。這個(gè)動(dòng)作是不可編程的。所以排在最前面的section一定要包含有程序的入口點(diǎn),否則系統(tǒng)無(wú)法正常運(yùn)行。
          2)輸入段與輸出端之間的對(duì)應(yīng)關(guān)系。理論上,任何section,都可以被隨意的映射到一個(gè)輸出段中。一個(gè).datasection是可以與一個(gè).textsection組成輸出一個(gè).text的。當(dāng)然這樣的動(dòng)作毫無(wú)意義。我們必須告訴linker使用那些section作為輸入,產(chǎn)生一個(gè)輸出section.
          以上這兩個(gè)問(wèn)題,都是通過(guò)一個(gè)稱為連接腳本的文件控制的。Linker通過(guò)讀取連接腳本,來(lái)決定section從輸入到輸出的映射,設(shè)置程序的入口點(diǎn),設(shè)置哪個(gè)section應(yīng)該在整個(gè)可執(zhí)行文件的頭部等問(wèn)題。
          連接腳本還有另外一個(gè)作用,那就是指定每個(gè)section的地址。在section合并完成后,linker將跟據(jù).symtab,對(duì)符號(hào)進(jìn)行統(tǒng)一的編址,分配一個(gè)絕對(duì)的運(yùn)行時(shí)地址。這個(gè)地址是以section地址作為基地址的。假設(shè).textsection的地址是0x00000000,那么.text里面的符號(hào)將以0x00000000這個(gè)地址作為基準(zhǔn)地址。指定section地址的工作也是由連接腳本完成。在嵌入式開(kāi)發(fā)中常見(jiàn)的在編譯工程時(shí)需指定的text_base,data_base等參數(shù),最后會(huì)被加入到連接腳本中,從而完成section的地址分配。
          以上兩步完成后,linker執(zhí)行引用符號(hào)重定位操作。Linker遍歷.relsection(包括.reltext和.reldata),對(duì)于其中的每個(gè)數(shù)據(jù)項(xiàng),根據(jù)symbol域到.symtab中查出相應(yīng)的引用的真實(shí)地址(經(jīng)過(guò)上面的地址分配,現(xiàn)在.symtab里面的符號(hào)都具有絕對(duì)的運(yùn)行地址),再根據(jù)offset域提供的偏移,將這個(gè)地址填入相應(yīng)的位置上。
          至此,符號(hào)重定位工作全部完成。Linker刪除用于保存重定位信息的rel.text和rel.datasection,加入一個(gè)segmentheader和一個(gè).initsection。生成可執(zhí)行的ELF格式的object文件。
          Segmentheader保存了用于操作系統(tǒng)內(nèi)存映射的信息。.initsection包含了一個(gè)_init的函數(shù)。程序加載時(shí),操作系統(tǒng)的程序加載器通過(guò)讀取segmentheader,將程序加載到用戶內(nèi)存空間,并根據(jù)segmentheader里面映射信息,分別將.text段和.data段映射到適當(dāng)?shù)牡刂飞?。然后再調(diào)用.init中的_init函數(shù),完成初始化工作。
          由于ELF文件具有通用性強(qiáng)的優(yōu)點(diǎn),現(xiàn)在流行的開(kāi)發(fā)模式是,先通過(guò)編譯工具生成ELF文件格式的可執(zhí)行文件,在使用外部工具,抽離出ELF文件中的相應(yīng)部分,生成BIN文件。例如著名的GNUbootloaderU-Boot,就采用了這種做法,編譯器工具集是GCC,BIN生成工具是elf2bin。ARM公司著名的開(kāi)發(fā)環(huán)境ADS,雖然使用的是自家的armcc,和armcpp編譯器,但他們的工作方式卻是與GNUGCC如出一轍。



          評(píng)論


          技術(shù)專區(qū)

          關(guān)閉