編寫Linux網(wǎng)絡(luò)驅(qū)動程序中需要注意的問題
——
Linux系統(tǒng)運(yùn)行幾個(gè)設(shè)備共享同一個(gè)中斷。需要共享的話,在申請的時(shí)候指明共享方式。
系統(tǒng)提供的request_irq()調(diào)用的定義:
int request_irq(unsigned int irq,
void (*handler)(int irq, void *dev_id, struct pt_regs *regs),
unsigned long irqflags,
const char * devname,
void *dev_id);
如果共享中斷,irqflags設(shè)置SA_SHIRQ屬性,這樣就允許別的設(shè)備申請同一個(gè)中斷。需
要注意所有用到這個(gè)中斷的設(shè)備在調(diào)用request_irq()都必須設(shè)置這個(gè)屬性。系統(tǒng)在回調(diào)
每個(gè)中斷處理程序時(shí),可以用dev_id這個(gè)參數(shù)找到相應(yīng)的設(shè)備。一 般dev_id就設(shè)為dev
ice結(jié)構(gòu)本身。系統(tǒng)處理共享中斷是用各自的dev_id參數(shù)依次調(diào)用每一個(gè)中斷處理程序。
3.2 硬件發(fā)送忙時(shí)的處理
主CPU的處理能力一般比網(wǎng)絡(luò)發(fā)送要快,所以經(jīng)常會遇到系統(tǒng)有數(shù)據(jù)要發(fā),但上一包數(shù)據(jù)
網(wǎng)絡(luò)設(shè)備還沒發(fā)送完。因?yàn)樵贚inux里網(wǎng)絡(luò)設(shè)備驅(qū)動程序一般不做數(shù)據(jù)緩存,不能發(fā)送的
數(shù)據(jù)都是通知系統(tǒng)發(fā)送不成功,所以必須要有一個(gè)機(jī)制在硬件不忙時(shí)及時(shí)通知系統(tǒng)接著
發(fā)送下面的數(shù)據(jù)。
一般對發(fā)送忙的處理在前面設(shè)備的發(fā)送方法(hard_start_xmit)里已經(jīng)描述過,即如果發(fā)
送忙,置tbusy為1。處理完發(fā)送數(shù)據(jù)后,在發(fā)送結(jié)束中斷里清tbusy,同時(shí)用mark_bh()
調(diào)用通知系統(tǒng)繼續(xù)發(fā)送。
但在具體實(shí)現(xiàn)我的驅(qū)動程序時(shí)發(fā)現(xiàn),這樣的處理系統(tǒng)好象并不能及時(shí)地知道硬件已經(jīng)空
閑了,即在mark_bh()以后,系統(tǒng)要等一段時(shí)間才會接著發(fā)送。造成發(fā)送效率很低。2M線
路只有10%不到的使用率。內(nèi)核版本為2.0.35。
我最后的實(shí)現(xiàn)是不把tbusy置1,讓系統(tǒng)始終認(rèn)為硬件空閑,但是報(bào)告發(fā)送不成功。系統(tǒng)
會一直嘗試重發(fā)。這樣處理就運(yùn)行正常了。但是遍循內(nèi)核源碼中的網(wǎng)絡(luò)驅(qū)動程序,似乎
沒有這樣處理的。不知道癥結(jié)在哪里。
3.3 流量控制(flow control)
網(wǎng)絡(luò)數(shù)據(jù)的發(fā)送和接收都需要流量控制。這些控制是在系統(tǒng)里實(shí)現(xiàn)的,不需要驅(qū)動程序
做工作。每個(gè)設(shè)備數(shù)據(jù)結(jié)構(gòu)里都有一個(gè)參數(shù)dev->tx_queue_len,這個(gè)參數(shù)標(biāo)明發(fā)送時(shí)最
多緩存的數(shù)據(jù)包。在Linux系統(tǒng)里以太網(wǎng)設(shè)備(10/100Mbps)tx_queue_len一般設(shè)置為100
,串行線路(異步串口)為10。實(shí)際上如果看源碼可以知道,設(shè)置了dev->tx_queue_len并
不是為緩存這些數(shù)據(jù)申請了空間。這個(gè)參數(shù)只是在收到協(xié)議層的數(shù)據(jù)包時(shí)判斷發(fā)送隊(duì)列
里的數(shù)據(jù)是不是到了tx_queue_len的限度,以決定這一包數(shù)據(jù)加不加進(jìn)發(fā)送隊(duì)列。發(fā)送
時(shí)另一個(gè)方面的流控是更高層協(xié)議的發(fā)送窗口(TCP協(xié)議里就有發(fā)送窗口)。達(dá)到了窗口大
小,高層協(xié)議就不會再發(fā)送數(shù)據(jù)。
接收流控也分兩個(gè)層次。netif_rx()緩存的數(shù)據(jù)包有限制。另外高層協(xié)議也會有一個(gè)最
大的等待處理的數(shù)據(jù)量。
發(fā)送和接收流控處理在net/core/dev.c的do_dev_queue_xmit()和netif_rx()中。
3.4 調(diào)試
很多Linux的驅(qū)動程序都是編譯進(jìn)內(nèi)核的,形成一個(gè)大的內(nèi)核文件。但對調(diào)試來說,這是
相當(dāng)麻煩的。調(diào)試驅(qū)動程序可以用module方式加載。支持模塊方式的驅(qū)動程序必須提供
兩個(gè)函數(shù):int init_module(void)和void cleanup_module(void)。init_module()在加
載此模塊時(shí)調(diào)用,在這個(gè)函數(shù)里可以register_netdev()注冊設(shè)備。init_module()返回
0表示成功,返回負(fù)表示失敗。cleanup_module()在驅(qū)動程序被卸載時(shí)調(diào)用,清除占用的
資源,調(diào)用unregister_netdev()。
模塊可以動態(tài)地加載、卸載。在2.0.xx版本里,還有kerneld自動加載模塊,但是2.2.x
x中已經(jīng)取消了kerneld。手工加載使用insmod命令,卸載用rmmod命令,看內(nèi)核中的模塊
用lsmod命令。
編譯驅(qū)動程序用gcc,主要命令行參數(shù)-DKERNEL -DMODULE。并且作為模塊加載的驅(qū)動程
序,只編譯成obj形式(加-c參數(shù))。編譯好的目標(biāo)文件放在/lib/modules/2.x.xx/misc下
,在啟動文件里用insmod加載。
四.進(jìn)一步的閱讀
Linux程序設(shè)計(jì)資料可以從網(wǎng)上獲得。這就是開放源代碼的好處。并且沒有什么“未公開
的秘密”。我編寫驅(qū)動程序時(shí)參閱的主要資料包括:
Linux內(nèi)核源代碼
<<The Linux Kernel Hackers Guide>> by Michael K. Johnson
<<Linux Kernel Module Programming Guide>> by Ori Pomerantz
<Linux下的設(shè)備驅(qū)動程序> by olly in BBS水木清華站
可以選擇一個(gè)模板作為開始,內(nèi)核源代碼里有一個(gè)網(wǎng)絡(luò)驅(qū)動程序的模板,
drivers/net/skeleton.c。里面包含了驅(qū)動程序的基本內(nèi)容。但這個(gè)模板是以以太網(wǎng)設(shè)
備為對象的,以太網(wǎng)的處理在Linux系統(tǒng)里有特殊“待遇”,所以如果不是以太網(wǎng)設(shè)備,
有些細(xì)節(jié)上要注意,主要在初始化程序里。
最后,多參照別人寫的程序,聽聽其他開發(fā)者的經(jīng)驗(yàn)之談大概是最有效的幫助了。
評論