linux系統(tǒng)編程之基礎(chǔ)必備(六):可重入函數(shù)、sig
一、 POSIX 中對可重入和線程安全這兩個概念的定義:
本文引用地址:http://cafeforensic.com/article/201610/305552.htmReentrant Function:A function whose effect, when called by two or more threads,is guaranteed to be as if
the threads each executed the function one after another in an undefined order, even if the actual execution is interleaved.
Thread-Safe Function:A function that may be safely invoked concurrently by multiple threads.
Async-Signal-Safe Function: A function that may be invoked, without restriction from signal-catching functions. No function is async-signal -safe unless explicitly described as such.
以上三者的關(guān)系為:可重入函數(shù) 必然 是 線程安全函數(shù) 和 異步信號安全函數(shù); 線程安全函數(shù)不一定是可重入函數(shù)。
可重入與線程安全的區(qū)別體現(xiàn)在能否在signal處理函數(shù)中被調(diào)用的問題上,可重入函數(shù)在signal處理函數(shù)中可以被安全調(diào)用,因此同時也是Async-Signal-Safe Function;而線程安全函數(shù)不保證可以在signal處理函數(shù)中被安全調(diào)用,如果通過設(shè)置信號阻塞集合等方法保證一個非可重入函數(shù)不被信號中斷,那么它也是Async-Signal-Safe Function。
舉個例子,strtok是既不可重入的,也不是線程安全的;加鎖的strtok不是可重入的,但線程安全;而strtok_r既是可重入的,也是線程安全的。也就是說函數(shù)如果使用靜態(tài)變量,通過加鎖后可以轉(zhuǎn)成線程安全函數(shù),但仍然有可能不是可重入的。我們所熟知的alloc也是線程安全但不是可重入的。
再舉個例子,假設(shè)函數(shù)func()在執(zhí)行過程中需要訪問某個共享資源,因此為了實現(xiàn)線程安全,在使用該資源前加鎖,在不需要資源解鎖。 假設(shè)該函數(shù)在某次執(zhí)行過程中,在已經(jīng)獲得資源鎖之后,有異步信號發(fā)生,程序的執(zhí)行流轉(zhuǎn)交給對應(yīng)的信號處理函數(shù);再假設(shè)在該信號處理函數(shù)中也需要調(diào)用函數(shù) func(),那么func()在這次執(zhí)行中仍會在訪問共享資源前試圖獲得資源鎖,然而我們知道前一個func()實例已然獲得該鎖,因此信號處理函數(shù)阻塞;另一方面,信號處理函數(shù)結(jié)束前被信號中斷的線程是無法恢復(fù)執(zhí)行的,當然也沒有釋放資源的機會,這樣就出現(xiàn)了線程和信號處理函數(shù)之間的死鎖局面。
因此,func()盡管通過加鎖的方式能保證線程安全,但是由于函數(shù)體對共享資源的訪問,因此是非可重入。
對于這種情況,采用的方法一般是在特定的區(qū)域屏蔽一定的信號。
二、可重入函數(shù)
我們知道,當捕捉到信號時,不論進程的主控制流程當前執(zhí)行到哪兒,都會先跳到信號處理函數(shù)中執(zhí)行,從信號處理函數(shù)返回后再繼續(xù)執(zhí)行主控制流程。信號處理函數(shù)是一個單獨的控制流程,因為它和主控制流程是異步的,二者不存在調(diào)用和被調(diào)用的關(guān)系,并且使用不同的堆??臻g。引入了信號處理函數(shù)使得一個進程具有多個控制流程,如果這些控制流程訪問相同的全局資源(全局變量、硬件資源等),就有可能出現(xiàn)沖突,如下面的例子所示。
main函數(shù)調(diào)用insert函數(shù)向一個鏈表head中插入節(jié)點node1,插入操作分為兩步,剛做完第一步的時候,因為硬件中斷使進程切換到內(nèi)核,再次回用戶態(tài)之前檢查到有信號待處理,于是切換到sighandler函數(shù),sighandler也調(diào)用insert函數(shù)向同一個鏈表head中插入節(jié)點node2,插入操作的兩步都做完之后從sighandler返回內(nèi)核態(tài),再次回到用戶態(tài)就從main函數(shù)調(diào)用的insert函數(shù)中繼續(xù)往下執(zhí)行,先前做第一步之后被打斷,現(xiàn)在繼續(xù)做完第二步。結(jié)果是,main函數(shù)和sighandler先后向鏈表中插入兩個節(jié)點,而最后只有一個節(jié)點真正插入鏈表中了。
像上例這樣,insert函數(shù)被不同的控制流程調(diào)用,有可能在第一次調(diào)用還沒返回時就再次進入該函數(shù),這稱為重入,insert函數(shù)訪問一個全局鏈表,有可能因為重入而造成錯亂,像這樣的函數(shù)稱為不可重入函數(shù),反之,如果一個函數(shù)只訪問自己的局部變量或參數(shù),則稱為可重入(Reentrant)函數(shù)。
不可重入函數(shù)的原因在于:
1> 已知它們使用靜態(tài)數(shù)據(jù)結(jié)構(gòu)
2> 它們調(diào)用malloc和free.
因為malloc通常會為所分配的存儲區(qū)維護一個鏈接表,而插入執(zhí)行信號處理函數(shù)的時候,進程可能正在修改此鏈接表。
3> 它們是標準IO函數(shù).
因為標準IO庫的很多實現(xiàn)都使用了全局數(shù)據(jù)結(jié)構(gòu)
3、sig_atomic_t類型與volatile限定符
在上面的圖示例子中,main和sighandler都調(diào)用insert函數(shù)則有可能出現(xiàn)鏈表的錯亂,其根本原因在于,對全局鏈表的插入操作要分兩步完成,不是一個原子操作,假如這兩步操作必定會一起做完,中間不可能被打斷,就不會出現(xiàn)錯亂了。
關(guān)于原子操作最原始的說法是一條匯編指令能夠完成(對于多線程程序來說原子操作可以指加鎖后的幾個步驟集合),即使是一條C語句也不一定是一個原子操作,比如 a = 5; 如果a是32位的int變量,在32位機上賦值是原子操作,在16位機上就不是。如果在程序中需要使用一個變量,要保證對它的讀寫都是原子操作,應(yīng)該采用什么類型呢?
為了解決這些平臺相關(guān)的問題,C標準定義了一個類型sig_atomic_t,在不同平臺的C語言庫中取不同的類型,例如在32位機上定義sig_atomic_t為int類型。
在使用sig_atomic_t類型的變量時,還需要注意另一個問題??慈缦碌睦樱?/p>
#include
sig_atomic_t a=0;
int main(void)
{
/* register a sighandler */
while(!a); /* wait until a changes in sighandler */
/* do something after signal arrives *
/ return 0;
}
為了簡潔,這里只寫了一個代碼框架來說明問題。在main函數(shù)中首先要注冊某個信號的處理函數(shù)sighandler,然后在一個while死循環(huán)中等待信號發(fā)生,如果有信號遞達則執(zhí)行sighandler,在sighandler中將a改為1,這樣再次回到main函數(shù)時就可以退出while循環(huán),執(zhí)行后續(xù)處理。如果在編譯時加了優(yōu)化選項,則如果第一次比較a是否為0,如果相等則成了死循環(huán),因為不會再次從內(nèi)存讀取變量a的值。
評論