色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

          新聞中心

          EEPW首頁 > 測試測量 > 學(xué)習(xí)方法與實(shí)踐 > 基于GCC的嵌入式程序插裝技術(shù)

          基于GCC的嵌入式程序插裝技術(shù)

          作者:同濟(jì)大學(xué) 沈永清 徐中偉 時(shí)間:2008-01-25 來源:單片機(jī)及嵌入式系統(tǒng)應(yīng)用 收藏

                 軟件測試中,覆蓋、故障注入、性能分析等廣泛使用的動(dòng)態(tài)測試方法均基于程序插裝技術(shù)。

          本文引用地址:http://cafeforensic.com/article/78079.htm

                 本文介紹一種通過分析和修改GCC編譯工具,實(shí)現(xiàn)程序插裝的新方法。該方法具有批量自動(dòng)插裝,插裝與編譯連接緊密結(jié)合,適用語言廣泛等優(yōu)點(diǎn)。最后具體討論了如何在ARM嵌入式程序中實(shí)現(xiàn)程序插裝,并給出修改GCC的源代碼。

                 引 言
             

                  程序插裝(Program Instrumentation)概念最先是由J.G.Huang教授提出,是借助往被測程序中插入操作(稱為“探針”),以便獲取程序的控制流和數(shù)據(jù)流信息,從而實(shí)現(xiàn)測試目的的方法。在軟件動(dòng)態(tài)測試中,程序插裝是一種基本的測試手段,應(yīng)用廣泛,是覆蓋率測試、軟件故障注入和動(dòng)態(tài)性能分析的基礎(chǔ)技術(shù)。
             

                 GCC(GNU Compiler Collection)是一個(gè)高度優(yōu)化,高度可移植,廣泛使用的編譯系統(tǒng)。它能處理多種語言,包括C/C++、Fortran、Java和Pascal等多種語言前端,而且后端支持幾乎所有的處理器結(jié)構(gòu)。GCC作為源碼開放的軟件,人們可以自由修改和使用;加入插裝模塊后,在GCC所支持的語言中都可插入相應(yīng)的測試代碼(這里只介紹C語言的插裝模塊)。本文將詳細(xì)敘述如何修改GCC,使其在編譯每個(gè)C函數(shù)時(shí),分別將各個(gè)形式參數(shù)連同該函數(shù)名傳遞給一個(gè)指定函數(shù)。該指定函數(shù)的返回值賦予原來的形式參數(shù),從而可以人為控制被插裝函數(shù)的每個(gè)參數(shù)實(shí)際值,進(jìn)而完成各種規(guī)則下的測試。

                 1 GCC編譯流程分析
             

                 編譯器的工作是將源代碼(通常使用高級(jí)語言編寫)翻譯成目標(biāo)代碼(通常是低級(jí)的目標(biāo)代碼或者機(jī)器語言)。在現(xiàn)代編譯器的實(shí)現(xiàn)中,這個(gè)工作一般是分為兩個(gè)階段來實(shí)現(xiàn)的:
             

                 第一階段,編譯器的前端接收輸入的源代碼,經(jīng)過詞法、語法和語義分析等得到源程序的某種中間表示方式。
             

                 第二階段,編譯器的后端將前端處理生成的中間表示方式進(jìn)行一些優(yōu)化,并最終生成在目標(biāo)機(jī)器上可運(yùn)行的代碼。
             

                 GCC編譯器以一個(gè)函數(shù)為單位對(duì)經(jīng)過預(yù)處理的輸入源文件進(jìn)行編譯處理。根據(jù)GNU Bison(一個(gè)類似YACC但功能更強(qiáng)大的文法分析工具)生成的語法分析程序,前端完成語法、語義分析,建立語法樹,并轉(zhuǎn)換成中間代碼。GCC內(nèi)部使用了一種能對(duì)實(shí)際的體系結(jié)構(gòu)做一種抽象的,與硬件平臺(tái)無關(guān)的語言,這個(gè)中間語言就是RTL(Register Ttansfer Language)。通過修改源程序的RTL,可以改變、刪除源程序,包括插入所需要的代碼,由GCC后端處理并最終輸出對(duì)應(yīng)硬件平臺(tái)的匯編碼,源程序無需手工修改便可實(shí)現(xiàn)插裝功能。
             

                 GCC的入口點(diǎn)main函數(shù)在文件main.c中。此函數(shù)非常簡單,只有一條直接調(diào)用toplev_main函數(shù)的語句。toplev_main函數(shù)是在toplev.c文件中定義的,以下我們只關(guān)心與編譯有關(guān)的源碼,其他的暫時(shí)忽略。toplev_main中最重要的是調(diào)用了do_complile函數(shù),這個(gè)函數(shù)從名字看就是做編譯工作的;而在此之后,toplev_main函數(shù)就返回了。dD_compile函數(shù)也是在tokv.c中定義的,其中真正進(jìn)行編譯工作的是調(diào)用compilte_file函數(shù)。compik_file函數(shù)最終調(diào)用了一個(gè)鉤子函數(shù)來分析(parse)整個(gè)輸入文件:
            

                   (*lang_hooks.parse_file)(set_yydebug);
             

                  這里的lang_hooks是一個(gè)全局變量,不同語言的前端對(duì)此賦以不同的值。對(duì)C語言來說,這條語句相當(dāng)于調(diào)用了c-opts.c中的c_common_parse_file函數(shù)。c_com-mon_parse_file中調(diào)用了c-parse.c中的c_parse_file函數(shù);在此函數(shù)中又調(diào)用了同文件中的yyparse函數(shù),該函數(shù)負(fù)責(zé)解析C語言源文件,并轉(zhuǎn)化為特殊的語法樹結(jié)構(gòu)。該函數(shù)是GNU bison將YACC轉(zhuǎn)變?yōu)镃語言而自動(dòng)生成的,所以這段代碼閱讀起來比較困難,但我們并不關(guān)心語法分析的細(xì)節(jié)。在完成函數(shù)體的分析后,利用已經(jīng)建立的tree結(jié)構(gòu)生成RTL,優(yōu)化后最終輸出匯編碼;自此C函數(shù)的編譯就算結(jié)束了,這些是由yyparse調(diào)用finish_function函數(shù)完成的。finish_function函數(shù)中最重要的函數(shù)是tree_rest_of_compilation(定義在tree_optimize.c中),它是真正實(shí)現(xiàn)上述功能的函數(shù)。為了說明它所做的具體事情,我們將該函數(shù)做了刪減,保留了關(guān)鍵的地方。


                  將函數(shù)各個(gè)部分展開成RTL形式后,調(diào)用函數(shù)rest_of_compilation將RTL輸出為匯編碼。至此,得到了一張清晰的GCC編譯時(shí)的函數(shù)調(diào)用路線,如表1所列。

                2 基于GCC的程序插裝技術(shù)
             

                 根據(jù)插裝測試的要求,需要在函數(shù)開始時(shí)為每個(gè)參數(shù)調(diào)用鉤子函數(shù),并用鉤子函數(shù)的返回值更新參數(shù)的值;同時(shí),將被插裝函數(shù)的名稱壓入函數(shù)本地棧內(nèi),作為該函數(shù)的一個(gè)匿名本地變量,只用于傳遞給鉤子函數(shù)。從上面列出的tree_rest_of_compilation函數(shù)源碼得知,負(fù)責(zé)建立被編譯函數(shù)參數(shù)和返回值的函數(shù)是expand_function_start,定義是在文件function.c中。expand_function_start中處理函數(shù)參數(shù)和返回值的函數(shù)是assign_parms,這是需要特別關(guān)注的函數(shù)。以下是該函數(shù)簡化的偽碼:

                  斜體加粗的部分是增加的代碼。在for循環(huán)前,獲得當(dāng)前編譯的函數(shù)名(見源碼中①位置);但暫時(shí)不能輸出到函數(shù)的RTL鏈中,因?yàn)楸镜貤R谒袇?shù)傳遞完畢才完全建立起來。在for循環(huán)體結(jié)束前,記錄下函數(shù)參數(shù)的一份拷貝(見②),最后調(diào)用。insert_function_name_local函數(shù),將當(dāng)前函數(shù)名插入本地棧,并且修正棧指針(見③)。經(jīng)過以上修改,得到了插裝所需的所有信息,包括函數(shù)參數(shù)和函數(shù)名稱的RTX表示。GCC將函數(shù)編譯后生成的RTX表示以鏈表形式組織,最后一次性把這個(gè)RTX鏈表輸出為后端平臺(tái)的匯編碼。完成這項(xiàng)工作的是rest_of_compilation函數(shù),所以在調(diào)用rest_of_complilation函數(shù)前插入我們的RTX,最終完成插裝,由函數(shù)inject_rtl負(fù)責(zé)完成。下面是inject_rtl的主要代碼:


                  3 APCS與程序插裝實(shí)現(xiàn)
             

                  編譯器必須以一套統(tǒng)一的方法編譯函數(shù)的定義和調(diào)用過程,才能確保不同語言編寫的函數(shù)能相互調(diào)用。規(guī)定這些細(xì)節(jié)的便叫作“函數(shù)調(diào)用規(guī)范(Procedure Call Stand-ard)”。ARM體系結(jié)構(gòu)定義了自己的函數(shù)調(diào)用規(guī)范——ARM函數(shù)調(diào)用標(biāo)準(zhǔn)(ARM Procedure Call Standard,APCS)。雖然APCS不是強(qiáng)制性的,但實(shí)現(xiàn)APCS并不困難,而且可獲得統(tǒng)一的二進(jìn)制兼容的好處,所以大部分的編譯器都實(shí)現(xiàn)了APCS,其中包括GCC。
             

                  APCS中函數(shù)傳遞參數(shù)的定義如下:
             

                 ◇前4個(gè)整數(shù)實(shí)參(或者更少)被裝載到r0~r3。前4個(gè)整數(shù)實(shí)參(或者更少)被裝載到r0~r3。
                 ◇前4個(gè)浮點(diǎn)實(shí)參(或者更少)被裝載到f0~f3。
                 ◇如果參數(shù)為雙字(8字節(jié)),就必須從偶數(shù)寄存器開始放置。
                 ◇如果一個(gè)參數(shù)不能完全放入寄存器中,則超過的那部分拷貝到棧中。
             

                 其他任何實(shí)參(如果有的話)存儲(chǔ)在內(nèi)存中,用進(jìn)入函數(shù)時(shí)緊接在sp值上面的字來指向。換句話說,其余的參數(shù)被壓入棧頂。所以,要想簡單,最好定義接受4個(gè)或更少的整數(shù)參數(shù)的函數(shù)。
             

                 本文所述的插入函數(shù)只有兩個(gè)整型形參,所以調(diào)用時(shí)只需將兩個(gè)實(shí)參分別傳入ro和rl。GCC提供emit_li-brary_call函數(shù)用來生成函數(shù)調(diào)用的RTL碼,GCC將按照APCS產(chǎn)生正確的函數(shù)調(diào)用匯編碼。函數(shù)定義在calls.c中,原型為:


                   插入所需函數(shù)后,需要將返回值賦值給對(duì)應(yīng)的被插裝函數(shù)的形參。以下是插入函數(shù)insert_parms_test_function的完整代碼:

                4 實(shí) 例
             

                 為便于檢查插裝效果,用經(jīng)過修改的GCC編譯一段簡單的C語言程序。該程序?yàn)橐粋€(gè)獨(dú)立函數(shù)foo,接受兩個(gè)整數(shù)類型的參數(shù)。具體代碼如下:

             

                  從GCC輸出的匯編碼可以看到,foo函數(shù)的兩個(gè)參數(shù)都經(jīng)過鉤子函數(shù)pt_hook_partns的處理更新;在pt_hook_parms函數(shù)內(nèi),可以根據(jù)測試算法返回不同的邊界值,從而達(dá)到測試的目的。依照此方法,一個(gè)實(shí)際程序經(jīng)過插裝后,在ARM模擬器上順利運(yùn)行,并取得預(yù)期的測試效果。

                  結(jié)語
             

                   本文詳細(xì)地論述了修改GCC增加插裝功能的實(shí)現(xiàn)方法。按照這樣的思路,成功地實(shí)現(xiàn)了基于ARM7芯片的嵌入式系統(tǒng)的動(dòng)態(tài)參數(shù)邊界測試,達(dá)到了預(yù)期的效果。本文所述的插裝函數(shù)比較簡單,沒有區(qū)分參數(shù)的類型,所有參數(shù)均按照一個(gè)字大小來處理;下一步的工作是細(xì)分參數(shù)不同類型,插裝不同的處理函數(shù)。作為一種通用的插裝方法,在此摹礎(chǔ)上.通過識(shí)別不同的插裝點(diǎn)和插裝不同的函數(shù),可以實(shí)現(xiàn)函數(shù)調(diào)用棧檢查,程序覆蓋率測試,獲取函數(shù)實(shí)際執(zhí)行時(shí)間等需要插裝技術(shù)作為基礎(chǔ)的功能。



          關(guān)鍵詞:

          評(píng)論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉