gdbserver調(diào)試共享庫(kù)
在開(kāi)發(fā)嵌入式系統(tǒng)時(shí),調(diào)試往往是一大難題。面試過(guò)不少嵌入式linux工程師,當(dāng)問(wèn)及調(diào)試手段時(shí),他們的調(diào)試手段一般是兩種:首先是在PC上的模擬環(huán)境中運(yùn)行,若有問(wèn)題,可以很方便的調(diào)試。其次,若在板子上運(yùn)行時(shí)才出錯(cuò),就用printf輸出log信息,根據(jù)log信息定位錯(cuò)誤。有少部分人用gdbserver調(diào)試板子上的程序,但問(wèn)到如何在共享庫(kù)里設(shè)置斷點(diǎn)時(shí),都說(shuō)沒(méi)有辦法。
本文引用地址:http://cafeforensic.com/article/76986.htm去年,Tinyx的一個(gè)內(nèi)存越界BUG,花了我2天時(shí)間。gcc的一個(gè)浮點(diǎn)數(shù)BUG讓我查了3天時(shí)間。這類(lèi)BUG在PC上根本重現(xiàn)不了,在板子上用printf要花費(fèi)大量的時(shí)間才能把錯(cuò)誤的范圍縮小一點(diǎn)。后來(lái)想了想,與其花時(shí)間去加printf,還不如把gdbserver調(diào)試共享庫(kù)的問(wèn)題解決了,可以為以后的調(diào)試節(jié)省不少時(shí)間。
在網(wǎng)上找了半天資料,沒(méi)有什么收獲,看來(lái)只好自己動(dòng)手研究?;艘粋€(gè)周末的時(shí)間去研究gdbserver的運(yùn)行方式。辦法是找到了,不過(guò)仍然有點(diǎn)麻煩,等有時(shí)間了,修改一下gdb的代碼,把這個(gè)過(guò)程自動(dòng)化了。
先調(diào)試運(yùn)行g(shù)dbserver,對(duì)gdbserver有了一些感性認(rèn)識(shí),然后研究linux-low.c中的代碼。原來(lái),設(shè)置斷點(diǎn)只是在對(duì)應(yīng)的內(nèi)存中寫(xiě)入斷點(diǎn)指令(x86上為0xcc)。
gdbserver為什么不能在共享庫(kù)中設(shè)置斷點(diǎn)呢?設(shè)置斷點(diǎn)只是寫(xiě)內(nèi)存,調(diào)試時(shí),所有的代碼段都是可寫(xiě)的,在exe中可以設(shè)置斷點(diǎn),沒(méi)有理由不讓在共享庫(kù)中設(shè)置啊。所以這應(yīng)該與是否是共享庫(kù)關(guān)系不大。
猜測(cè)可能是符號(hào)與地址對(duì)應(yīng)關(guān)系有誤,如果你的本意為function1設(shè)置斷點(diǎn),結(jié)果gdb搞錯(cuò)了,設(shè)置一個(gè)毫不相干的地方,可能永遠(yuǎn)都不會(huì)執(zhí)行到那里,這個(gè)斷點(diǎn)自然沒(méi)什么效果。
如果是這樣,有兩種方法可以解決:要么手動(dòng)計(jì)算符號(hào)的地址,再設(shè)置斷點(diǎn),當(dāng)然這樣太累。另外就讓gdb自動(dòng)對(duì)應(yīng)起來(lái)。經(jīng)過(guò)反得嘗試,用下列方法可以在共享庫(kù)中設(shè)置斷點(diǎn),雖然有點(diǎn)麻煩,還是可行的。
1. 準(zhǔn)備工作,編寫(xiě)下面幾個(gè)文件:
test.c:
#include
int test(int a, int b)
{
int s = a + b;
printf("%dn", s);
return s;
}
main.c:
#include
extern int test(int a, int b);
int main(int argc, char* argv[])
{
int s = test(10, 20);
return s;
}
Makefile:
all: so main
so:
gcc -g test.c -shared -o libtest.so
main:
gcc -g main.c -L./ -ltest -o test.exe
clean:
rm -f *.exe *.so
(為了便于演示,整個(gè)過(guò)程在PC上測(cè)試,后來(lái)證實(shí)在實(shí)驗(yàn)板上能夠正常工作)
2. 編譯并設(shè)置環(huán)境變量
make
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:./
3. 運(yùn)行g(shù)dbserver
gdbserver localhost:2000 ./test.exe
4. 運(yùn)行g(shù)db客戶(hù)端
gdb
symbol-file test.exe
target remote localhost:2000
b main
c
5. 查看libtest.so的代碼在內(nèi)存中的位置。
(從gdbserver的輸出或者用ps可以得到test.exe的進(jìn)程ID,這里假設(shè)PID是11547)
cat /proc/11547/maps
輸出:
00624000-0063e000 r-xp 00000000 03:01 718192 /lib/ld-2.3.5.so
0063e000-0063f000 r-xp 00019000 03:01 718192 /lib/ld-2.3.5.so
0063f000-00640000 rwxp 0001a000 03:01 718192 /lib/ld-2.3.5.so
00642000-00766000 r-xp 00000000 03:01 718193 /lib/libc-2.3.5.so
00766000-00768000 r-xp 00124000 03:01 718193 /lib/libc-2.3.5.so
00768000-0076a000 rwxp 00126000 03:01 718193 /lib/libc-2.3.5.so
0076a000-0076c000 rwxp 0076a000 00:00 0
00bbe000-00bbf000 r-xp 00bbe000 00:00 0
00fcc000-00fcd000 r-xp 00000000 03:01 1238761 /root/test/gdbservertest/libtest.so
00fcd000-00fce000 rwxp 00000000 03:01 1238761 /root/test/gdbservertest/libtest.so
08048000-08049000 r-xp 00000000 03:01 1238765 /root/test/gdbservertest/test.exe
08049000-0804a000 rw-p 00000000 03:01 1238765 /root/test/gdbservertest/test.exe
b7f8a000-b7f8b000 rw-p b7f8a000 00:00 0
b7f99000-b7f9a000 rw-p b7f99000 00:00 0
bfd85000-bfd9a000 rw-p bfd85000 00:00 0 [stack]
由此可以知道:libtest.so的代碼在00fcc000-00fcd000之間。
6. 查看libtest.so的.text段在內(nèi)存中的偏移位置:
objdump -h libtest.so |grep .text
輸出:
9 .text 00000130 00000450 00000450 00000450 2**4
即偏移位置為0x00000450
7. 回到gdb窗口,加載libtest.so的符號(hào)表。
add-symbol-file libtest.so 0x00fcc450
(這里0x00fcc450 = 0x00fcc000 + 0x00000450)
8. 在共享庫(kù)的函數(shù)中設(shè)置斷點(diǎn)。
b test
9. 繼續(xù)調(diào)試,可以發(fā)現(xiàn)在共享庫(kù)中設(shè)置的斷點(diǎn),能夠正常工作。
評(píng)論