Linux 可重入、異步信號安全和執行緒安全-有解無憂

可重入函式

當一個被捕獲的信號被一個行程處理時，行程執行的普通的指令序列會被一個信號處理器暫時地中斷，它首先執行該信號處理程式中的指令，如果從信號處理程式回傳（例如沒有呼叫exit或longjmp），則繼續執行在捕獲到信號時行程正在執行的正常指令序列（這和當一個硬體中斷發生時所發生的事情相似），但是在信號處理器里，我們并不知道當信號被捕獲時行程正在執行哪里的代碼，

如果行程正使用malloc在它的堆上分配額外的記憶體，而此時由于捕捉到信號而插入執行該信號處理程式，其中又呼叫了malloc，這會發生什么呢？或者，如果行程正呼叫一個把結果存盤在一個靜態區域里的函式到一半，比如 getpwnam，而我們在信號處理器里呼叫相同的函式，又會發生什么呢？在malloc的例子里，行程可能會遭到嚴重破壞，因為malloc通常維護它所有分配過的區域的鏈表，而插入執行信號處理程式時，行程可能正在更改此鏈接表，

在getpwnam的例子里，回傳給普通呼叫者的資訊可能被回傳給信號處理器的資訊覆寫，

SUS規定了必須保證是可以再入的函式，下表列出了這些再入函式：
在這里插入圖片描述

一個可重入的函式簡單來說就是可以被中斷的函式，也就是說，可以在這個函式執行的任何時刻中斷它，轉入OS 調度下去執行另外一段代碼，而回傳控制時不會出現什么錯誤，可重入（reentrant）函式可以由多于一個任務并發使用，而不必擔心資料錯誤，相反，不可重入（non-reentrant）函式不能由超過一個任務所共享，除非能確保函式的互斥（或者使用信號量，或者在代碼的關鍵部分禁用中斷），

可重入函式可以在任意時刻被中斷，稍后再繼續運行，不會丟失資料，可重入函式要么使用本地變數，要么在使用全域變數時保護自己的資料，

信號安全，其實也就是異步信號安全，是說執行緒在信號處理函式當中，不管以任何方式呼叫你的這個函式如果不死鎖不修改資料，那就是信號安全的，因此，我認為可重入與異步信號安全是一個概念，

執行緒安全

執行緒安全：一個函式被稱為執行緒安全的，當且僅當被多個并發執行緒反復的呼叫時，它會一直產生正確的結果，

有一類重要的執行緒安全函式，叫做可重入函式，其特點在于它們具有一種屬性：當它們被多個執行緒呼叫時，不會參考任何共享的資料，

盡管執行緒安全和可重入有時會（不正確的）被用做同義詞，但是它們之間還是有清晰的技術差別的，可重入函式是執行緒安全函式的一個真子集，

需要C/C++ Linux服務器架構師學習資料加群812855908（資料包括C/C++，Linux，golang技術，Nginx，ZeroMQ，MySQL，Redis，fastdfs，MongoDB，ZK，流媒體，CDN，P2P，K8S，Docker，TCP/IP，協程，DPDK，ffmpeg等），免費分享

l 在這里插入圖片描述

可重入與執行緒安全的區別及聯系

可重入函式：重入即表示重復進入，首先它意味著這個函式可以被中斷，其次意味著它除了使用自己堆疊上的變數以外不依賴于任何環境（包括static ），這樣的函式就是purecode （純代碼）可重入，可以允許有該函式的多個副本在運行，由于它們使用的是分離的堆疊，所以不會互相干擾，

可重入函式是執行緒安全函式，但是反過來，執行緒安全函式未必是可重入函式，

實際上，可重入函式很少，APUE 10.6 節中描述了Single UNIX Specification 說明的可重入的函式，只有115 個；APUE 12.5 節中描述了POSIX.1 中不能保證執行緒安全的函式，只有89 個，

信號就像硬體中斷一樣，會打斷正在執行的指令序列，信號處理函式無法判斷捕獲到信號的時候，行程在何處運行，如果信號處理函式中的操作與打斷的函式的操作相同，而且這個操作中有靜態資料結構等，當信號處理函式回傳的時候（當然這里討論的是信號處理函式可以回傳），恢復原先的執行序列，可能會導致信號處理函式中的操作覆寫了之前正常操作中的資料，

不可重入的幾種情況

使用靜態資料結構，比如getpwnam，getpwuid：如果信號發生時正在執行getpwnam，信號處理程式中執行getpwnam可能覆寫原來getpwnam獲取的舊值

呼叫malloc或free：如果信號發生時正在malloc（修改堆上存盤空間的鏈接表），信號處理程式又呼叫malloc，會破壞內核的資料結構
使用標準IO函式，因為好多標準IO的實作都使用全域資料結構，比如printf(檔案偏移是全域的)
函式中呼叫longjmp或siglongjmp：信號發生時程式正在修改一個資料結構，處理程式回傳到另外一處，導致資料被部分更新，

即使對于可重入函式，在信號處理函式中使用也需要注意一個問題就是errno ，一個執行緒中只有一個errno 變數，信號處理函式中使用的可重入函式也有可能會修改errno ，例如，read 函式是可重入的，但是它也有可能會修改errno ，因此，正確的做法是在信號處理函式開始，先保存errno ；在信號處理函式退出的時候，再恢復errno ，

例如，程式正在呼叫printf 輸出，但是在呼叫printf 時，出現了信號，對應的信號處理函式也有printf 陳述句，就會導致兩個printf 的輸出混雜在一起，

如果是給printf 加鎖的話，同樣是上面的情況就會導致死鎖，對于這種情況，采用的方法一般是在特定的區域屏蔽一定的信號，

屏蔽信號的方法：

  signal(SIGPIPE, SIG_IGN); // 忽略一些信號
  sigprocmask()；// sigprocmask 只為單執行緒定義的
  pthread_sigmask(); // pthread_sigmasks 可以在多執行緒中使用

現在看來信號異步安全和可重入的限制似乎是一樣的，所以這里把它們等同看待;

執行緒安全：如果一個函式在同一時刻可以被多個執行緒安全的呼叫，就稱該函式是執行緒安全的，Malloc 函式是執行緒安全的，

不需要共享時，請為每個執行緒提供一個專用的資料副本，如果共享非常重要，則提供顯式同步，以確保程式以確定的方式操作，通過將程序包含在陳述句中來鎖定和解除鎖定互斥，可以使不安全程序變成執行緒安全程序，而且可以進行串行化，

很多函式并不是執行緒安全的，因為他們回傳的資料是存放在靜態的記憶體緩沖區中的，通過修改介面，由呼叫者自行提供緩沖區就可以使這些函式變為執行緒安全的，

作業系統實作支持執行緒安全函式的時候，會對POSIX.1 中的一些非執行緒安全的函式提供一些可替換的執行緒安全版本，

例如,gethostbyname() 是執行緒不安全的，在Linux 中提供了gethostbyname_r() 的執行緒安全實作，

函式名字后面加上 _r ，以表明這個版本是可重入的（對于執行緒可重入，也就是說是執行緒安全的，但并不是說對于信號處理函式也是可重入的，或者是異步信號安全的），

多執行緒程式中常見的疏忽性問題:

將指標作為新執行緒的引數傳遞給呼叫方堆疊，
在沒有同步機制保護的情況下訪問全域記憶體的共享可更改狀態，
兩個執行緒嘗試輪流獲取對同一對全域資源的權限時導致死鎖，其中一個執行緒控制第一種資源，另一個執行緒控制第二種資源，其中一個執行緒放棄之前，任何一個執行緒都無法繼續操作，
嘗試重新獲取已持有的鎖（遞回死鎖），
在同步保護中創建隱藏的間隔，如果受保護的代碼段包含的函式釋放了同步機制，而又在回傳呼叫方之前重新獲取了該同步機制，則將在保護中出現此間隔，結果具有誤導性，對于呼叫方，表面上看全域資料已受到保護，而實際上未受到保護，
將UNIX 信號與執行緒混合時，使用sigwait(2) 模型來處理異步信號，
呼叫setjmp(3C) 和longjmp(3C) ，然后長時間跳躍，而不釋放互斥鎖，
從對*_cond_wait() 或 *_cond_timedwait() 的呼叫中回傳后無法重新評估條件，

總結

判斷一個函式是不是可重入函式，在于判斷其能否可以被打斷，打斷后恢復運行能夠得到正確的結果，（打斷執行的指令序列并不改變函式的資料）
判斷一個函式是不是執行緒安全的，在于判斷其能否在多個執行緒同時執行其指令序列的時候，保證每個執行緒都能夠得到正確的結果，
如果一個函式對多個執行緒來說是可重入的，則說這個函式是執行緒安全的，但這并不能說明對信號處理程式來說該函式也是可重入的，
如果函式對異步信號處理程式的重入是安全的，那么就可以說函式是” 異步-信號安全 ” 的，

可重入與執行緒安全是兩個獨立的概念，都與函式處理資源的方式有關，

首先，可重入和執行緒安全是兩個并不等同的概念，一個函式可以是可重入的，也可以是執行緒安全的，可以兩者均滿足，可以兩者皆不滿足( 該描述嚴格的說存在漏洞，參見第二條) ，

其次，從集合和邏輯的角度看，可重入是執行緒安全的子集，可重入是執行緒安全的充分非必要條件，可重入的函式一定是執行緒安全的，然過來則不成立，

第三，POSIX 中對可重入和執行緒安全這兩個概念的定義：

Reentrant Function :A function whose effect, when called by two or
more threads,is guaranteed to be as if the threads each executed
thefunction one after another in an undefined order, even ifthe
actual execution is interleaved.
Thread-Safe Function ：A function that may be safely invoked
concurrently by multiple threads.
Async-Signal-Safe Function ：A function that may be invoked, without
restriction fromsignal-catching functions. No function is
async-signal -safe unless explicitly described as such

以上三者的關系為：可重入函式必然是執行緒安全函式和異步信號安全函式；執行緒安全函式不一定是可重入函式，

可重入與執行緒安全的區別體現在能否在signal 處理函式中被呼叫的問題上，可重入函式在signal 處理函式中可以被安全呼叫，因此同時也是 Async-Signal-Safe Function ；而執行緒安全函式不保證可以在signal 處理函式中被安全呼叫，如果通過設定信號阻塞集合等方法保證一個非可重入函式不被信號中斷，那么它也是Async-Signal-Safe Function，

值得一提的是POSIX 1003.1 的 System Interface 預設是 Thread-Safe 的，但不是Async-Signal-Safe 的，Async-Signal-Safe 的需要明確表示，比如fork () 和signal() ，

一個非可重入函式通常( 盡管不是所有情況下) 由它的外部介面和使用方法即可進行判斷，例如：strtok() 是非可重入的，因為它在內部存盤了被標記分割的字串；ctime() 函式也是非可重入的，它回傳一個指向靜態資料的指標，而該靜態資料在每次呼叫中都被覆寫重寫，

一個執行緒安全的函式通過加鎖的方式來實作多執行緒對共享資料的安全訪問，執行緒安全這個概念，只與函式的內部實作有關，而不影響函式的外部介面，在 C 語言中，區域變數是在堆疊上分配的，因此，任何未使用靜態資料或其他共享資源的函式都是執行緒安全的，
目前的 AIX 版本中，以下函式庫是執行緒安全的：

C 標準函式庫
與BSD 兼容的函式庫

使用全域變數( 的函式) 是非執行緒安全的，這樣的資訊應該以執行緒為單位進行存盤，這樣對資料的訪問就可以串行化，一個執行緒可能會讀取由另外一個執行緒生成的錯誤代碼，在AIX 中，每個執行緒有獨立的errno 變數，

最后讓我們來構想一個執行緒安全但不可重入的函式:

假設函式func() 在執行程序中需要訪問某個共享資源，因此為了實作執行緒安全，在使用該資源前加鎖，在不需要資源解鎖，

假設該函式在某次執行程序中，在已經獲得資源鎖之后，有異步信號發生，程式的執行流轉交給對應的信號處理函式；再假設在該信號處理函式中也需要呼叫函式 func() ，那么func() 在這次執行中仍會在訪問共享資源前試圖獲得資源鎖，然而我們知道前一個func() 實體已然獲得該鎖，因此信號處理函式阻塞——另一方面，信號處理函式結束前被信號中斷的執行緒是無法恢復執行的，當然也沒有釋放資源的機會，這樣就出現了執行緒和信號處理函式之間的死鎖局面，

因此，func() 盡管通過加鎖的方式能保證執行緒安全，但是由于函式體對共享資源的訪問，因此是非可重入，

轉載請註明出處，本文鏈接：https://www.uj5u.com/qianduan/209130.html

標籤：其他

上一篇：使用Apache搭建Web網站服務器

下一篇：Java復習（十二）----多執行緒（二）