概述
信號是類UNIX系統中存在一種異步通信機制,用于內核通知用戶行程系統里發生了某個事件,例如,撰寫過應用程式的朋友應該都會遇到過”段錯誤“,引起段錯誤的信號就是SIGSEGV,此外,當用戶鍵入Ctrl+C之后,就可以停止前臺的終端行程,或者在終端通過kill命令就可以殺死某個行程,
在撰寫較為復雜的應用程式程式時,肯定會涉及到信號的檢測和處理,比如,在撰寫終端處理程式時,如何處理SIGINT信號(Ctrl+C)、SIGTSTP(Ctrl+Z)等信號;在撰寫TCP通信程式時,如何處理SIGPIPE信號;以及作業系統對于慢速系統呼叫被信號中斷的處理方式等,可以看到信號處理進行類Unix系統應用程式撰寫中,占有非常重要的地位,本文會從信號的基本概念開始,初步探究信號的基本原理,然后,著重總結信號處理程式的撰寫規范,最后,分析一下,信號涉及到的并發問題,
好了,廢話不多說,下面就開始信號的講解,
信號基本原理
類似于硬體中斷,信號本質上是系統發生一種**“軟體中斷”**,當作業系統內核檢測到某類事件時,便會通過信號的方式通知用戶行程,內核會在合適的時機呼叫此類信號事件對應的信號處理程式,完成信號的處理,每個信號都會系結一段信號處理程式,這段程式可以是默認的,也可以被應用程式重新定義(注意:SIGKILL,SIGSTOP不能被用戶捕捉),
基本術語
信號從產生到被目的行程處理一般分為兩個程序:
-
發送信號 當引發信號的事件發生時,內核就會檢測到該事件,并向行程(組)發送對應的信號,內核通過更新行程背景關系中涉及信號處理的標志位來通知行程發生了信號,這稱為信號的發生(generation),信號發生的原因可能是:1)硬體例外事件,比如除0、非法指令;2)終端通過kill命令或者應用程式通過kill,raise來顯示的發送信號,kill可以將信號發送給行程或行程組,raise允許行程向自身發送信號,
-
遞送信號 當內核檢測到行程有未處理的信號時,就強制行程中斷當前的指令處理,轉而去處理信號,這稱為信號的遞送(delivery),行程可以選擇忽略、終止或通過**”信號處理程式“**完成信號的處理,
-
未決的信號 當信號發生之后,信號被遞送之間的這段時間,稱為未決的信號(peding signal),任何時刻,一種型別的信號至多只會有一個未決的信號,如果對于信號s,行程存在一個未決的s信號,那么之后對于該行程的所有的s信號,都是簡單的丟失,不會排隊,一個未決的信號最多只能被**”遞送“**一次,
-
阻塞信號 行程可以阻塞某個信號,如果一個信號被阻塞了,那內核只會**“發送”信號,不會“遞送”信號,如果內核向行程發送了一個被阻塞的信號,而且對該信號的動作是默認動作或者捕捉該信號,這該行程將此信號保持為“未決的信號”狀態,直到該行程1)對此信號解除了阻塞;2)將對該信號的動作更改為忽略,這里需要的注意的是,內核在遞送信號到行程時,才會決定對于信號的處理動作,于是,在信號”遞送“**之前,仍可以改變對于信號的處理動作,
-
信號集合 內核為每個行程在pending位向量中,維護著”未決的信號”的集合,在信號掩碼(signal mask)位向量中維護著被阻塞的信號集合,
發送信號
類Unix系統提供了很多種向行程發送信號的機制,這些機制都是基于行程組這個概念,下面講到信號目的行程時,會涉及到行程組的概念,
行程組
每個行程都只屬于一個行程組,行程組是由一個正整數行程組ID來標識的,getpgrp回傳當前行程所屬的行程ID,默認的,子行程和父行程同屬于一個行程組,一個行程可以通過setpgid函式來改變自己或者其他行程的行程組,
#include <unistd.h>
int setpgid(pid_t pid, pid_t pgid);
回傳:若成功則回傳0, 若失敗回傳-1;
/bin/kill命令
/bin/kill命令可以向另外的**行程(組)**發送任意的信號,其格式如下:
# /bin/kill -signal pid
比如,
# /bin/kill -15 12345
向行程12345發送信號15,
# /bin/kill -15 -12345
一個負的pid表示信號被發送到行程組ID為12345的每個行程,
鍵盤發送信號
在鍵盤上輸入Ctrl+C會導致內核發送一個SIGINT信號到前臺行程組中的每個行程,默認情況下,結果時終止前臺行程,類似的,輸入Ctrl+Z會發送一個SIGTSTP信號到前臺行程組中的每個行程,默認情況下,結果時停止前臺行程,
kill/raise函式
#include <signal.h>
int kill(pid_t pid, int signo);
int raise(int signo);
兩個函式回傳值:若成功則回傳0, 若出錯則回傳-1
呼叫raise(signo)等價于呼叫
kill(getpid(), signo);
對于kill函式中的pid有幾種情況:
- pid > 0 :將該信號發送給行程ID為pid的行程;
- pid == 0:將該信號發送給與發送行程同屬于同一行程組的所有行程(包括發送行程自己),而且發送行程具有向這些行程發送信號的權限;
- pid < 0 :將該信號發送給其行程組ID等于pid的絕對值,并且發送行程具有向其發送信號的權限;
- pid == -1:將該行程發送給行程有權限向他們發送信號的系統上的所有行程,
接收信號
內核負責檢查行程是否存在未被阻塞的未決信號,并生成信號集合(pending & ~ signal_mask),如果集合為空,那么行程繼續執行;如果集合非空,那內核選擇集合中的某個信號(通常是最小的),強制要求行程“遞送”該信號,并觸發對于該信號的處理動作,信號處理完畢之后,如果行程沒有退出,行程繼續執行,每個信號都有一個默認的的信號處理動作,包括如下幾種:
- 行程終止;
- 行程終止并轉儲;
- 行程掛起直到被SIGCONT信號重啟;
- 行程忽略該信號,
可以通過man 7 signal命令查看Linux系統中信號的默認處理動作,
signal
除了信號的默認處理動作,應用程式還可以通過signal函式顯示的設定某個信號的處理動作(除了SIGKILL和SIGSTOP信號,他們的默認行為是不能被修改的),signal函式的原型如下:
#include <signal.h>
void (*signal(int signo, void (*func)(int))) (int);
回傳值:成功回傳信號以前的處理配置,出錯回傳SIG_ERR;
可以看到這個函式原型比較的復雜,我們通過typedef來簡化一下:
#include <signal.h>
typedef void *Sigfunc(int);
Sigfunc signal(int signo, Sigfunc *handler);
回傳值:成功回傳信號以前的處理配置,出錯回傳SIG_ERR;
其中,handler表示信號signo所系結的信號處理函式,
handler可以為下面三種方式之一:
- SIG_IGN:忽略型別為signo的信號;
- SIG_DFL:將型別為signo的信號處理行為恢復為默認行為;
- 用戶自定義的信號處理函式,函式原型為Sigfunc,
SIG_IGN、SIG_DFL、SIG_ERR宏的定義十分的有趣:
#define SIG_ERR (void (*)()) -1
#define SIG_DFL (void (*)()) 0
#define SIG_IGN (void (*)()) 1
由于歷史原因,signal函式可能存在幾個問題:
-
信號處理行為單次有效:在有些老的Unix系統中,行程每次接收到信號并對其處理之時,隨即將該信號動作復位為默認值,所以,需要重復呼叫signal函式達到重復處理某個信號的目的,比如典型的使用signal場景如下(這里以SIGINT為例):
int sig_int(); ... signal(SIGINT, sig_int); ... sig_int() { signal(SIGINT, sig_int); ... } -
導致信號丟失:由于signal的第一個原因,容易導致信號出現丟失的情況,還是上面的代碼,在sig_int中,再次呼叫signal之前,存在一個時間視窗,可能會發生了SIGINT信號,這時即便再次呼叫signal函式也不會捕捉到該信號,這就出現了信號的丟失,
阻塞信號
Linux系統提供了兩種阻塞信號的方式:隱式方式和顯示方式;
- 隱式阻塞方式:內核默認阻塞任何當前處理程式正在處理信號型別的待處理的信號,即對于同一個信號型別,一個行程只能串行處理該信號型別,處理程序中”發生“的該信號,內核會對其阻塞,使其處于”未決的“狀態,直到上一個信號處理完畢,
- 顯示阻塞方式:應用程式使用sigpromask函式和其輔助函式,明確的阻塞和解阻塞特定的信號,
類Unix系統中,關于信號集合有一個特殊的資料型別:sigset_t,可以通過該資料型別完成對于系統中信號的阻塞和解阻塞操作,圍繞該資料型別,系統定義一套工具函式,比如,sigemptyset、sigfillset、sigaddset、sigdelset、sigismember,可以通過man函式查詢它們的具體用法,
sigpromask函式可以檢測或更改行程的信號屏蔽字,其函式原型如下:
#include <signal.h>
int sigpromask(int how, const sigset_t *restrict set, sigset_t *restrict oset);
回傳值:成功回傳0, 失敗回傳-1;
- 若oset非空,其回傳行程當前的信號屏蔽字;
- 若set非空,則根據引數how完成對于行程信號屏蔽字的設定;
- how表示設定信號屏蔽字的方式:
- SIG_BLOCK:將set加入到當前的信號屏蔽字集合中, block = block | set;
- SIG_UNBLOCK:將set從當前的信號屏蔽字集合中去除,block = block & ~set;
- SIG_SETMASK:將set設定為當前的信號屏蔽字集合, block = block = set;
信號處理程式規范
信號處理是類Unix系統編程中比較棘手的一個問題,其需要面對幾個問題:
- 信號處理程式與主程式并發運行,容易導致對于共享資源的競爭訪問,
- 對于信號**“發生”和”遞送“**的規則不明確,容易導致進去信號處理的誤區,
- 不同的系統具有不同的信號處理語意,
下面分別對應于上面幾個問題,分別介紹撰寫安全、正確和可移植的信號處理程式的基本規范,
安全的信號處理
信號處理程式和主程式通常是并發的運行的,由于它們共享相同的全域資料資源,比如全域變數,極有可能導致對于相同資料的并發訪問,這很容易引入不可預知的問題,這類問題極難除錯,因為系統行為飄忽不定,問題不是必現的,所以為了安全的撰寫信號處理程式,這里總結了幾條保守的規則,用于避免此類問題,
處理程式要盡可能的簡單
類似于硬體中斷處理程式,要盡可能的簡單一樣,保持信號處理程式盡量的小和簡單,同樣是明智的,比如,信號處理程式中只是簡單的設定一個標志,然后立刻回傳,之后在主程式中處理回圈檢測該標志,進行后續的處理,
禁止呼叫異步信號不安全的函式
異步信號不全的函式,又稱不可重入的函式,一般情況下,一個函式是不可重入的主要原因是:1)函式使用的靜態的資料結構;2)函式呼叫了malloc和free函式族;3)函式直接或間接使用了標準I/O函式,比如,printf,標準I/O庫函式的很多實作都使用了全域資料結構,
由于信號處理程序是異步的,所以為了系統安全,禁止使用異步信號不安全的函式,注意很多常見的函式,比如printf、sprinf、malloc、free都是異步信號不安全的函式,Linux系統下,可以通過man 7 signal查詢系統下所有的異步安全的函式,如下圖所示:

在信號處理程式中唯一安全輸出的方式就是使用write函式,下面的是基于write實作的簡單、安全的I/O輸出函式:
ssize_t sio_puts(char s[]) /* Put string */
{
return write(STDOUT_FILENO, s, sio_strlen(s));
}
ssize_t sio_putl(long v) /* Put long */
{
char s[128];
sio_ltoa(v, s, 10); /* Based on K&R itoa();
return sio_puts(s);
}
void sio_error(char s[]) /* Put error message and exit */
{
sio_puts(s);
_exit(1);
}
保存和恢復errno
許多異步信號安全的函式都會在出錯回傳時設定errno,比如read、write函式,如果在信號處理函式里呼叫了這樣的函式,就可能會干擾主程式中其他依賴于errno的部分,解決方法是在進入信號處理函式時,保存errno到臨時變數里,等到處理函式回傳之前,恢復errno,
阻塞所有的信號
阻塞所有的信號的原因是為了保護對共享全域資料結構的訪問,信號處理函式和主程式如果都存在對于共享資料結構的訪問,那么在訪問這些共享資料結構之前,需要阻塞所有的信號,以避免并發的訪問這些資料結構,
用volatile宣告全域變數
volatile限定符強迫編譯器每次在代碼中引入變數時,都要從記憶體中讀取變數的值,
用sig_atomic_t宣告標志
前面說了,信號處理函式要盡量的簡單,一般只需要設定一個全域變數標志,C語言提供了sig_atomi_t這種資料型別來實作原子的訪問全域資料標志,比如:
volatile sig_atomic_t flag;
對于變數flag的讀寫時安全的,不可中斷,所以不需要訪問期間不需要阻塞所有的信號,但是,需要注意的是,這里原子的訪問,只適用于單個讀寫操作,flag=1,因為這些操作可以使用一條指令完成,但對于flag++或者flag=flag+1這種操作是不適用的,因為它們可能需要更多條的指令,
正確的信號處理
信號的一個與直覺不符的方面是未處理的信號是不排隊的,因為pending位向量中每種型別的信號只對應一位,所以每種型別最多只能有一個未處理的信號,舉個例子,對于信號s,如果當前行程正在執行信號s處理程式,這時如果發送了兩個s信號到這個行程,那么只有先到的信號被列為**“未決的”,后來的信號就直接丟棄了,所以,在設計信號相關的處理程式時,需要記住“未處理的信號是不排隊的”這條規則,關鍵思想時:如果存在一個未處理的信號就表明至少**有一個信號達到了,那么,后續的處理就是在信號處理函式中進行小心的設計,發現所有的信號帶來的變化,然后,全部處理掉,
可移植的信號處理
Unix信號處理的另一個缺陷在于不同的系統有不同的信號處理語意,比如:
- signal函式的語意各有不同,前文說過,由于歷史原因,signal存在兩點缺陷:需要重復呼叫和信號丟失;
- 系統呼叫函式可能被中斷,Unix系統呼叫可以分為快速和慢速兩種系統呼叫,像read、write、select這些系統呼叫可能會導致行程阻塞的系統呼叫稱為,慢速系統呼叫,如果信號中斷了這些慢速系統呼叫,不同版本的Unix系統處理方式是不同,有的系統,如果慢速系統呼叫被中斷,在其恢復之后,會立即回傳,并設定errno位EINTR,而有些系統會自動重啟中斷了的系統呼叫代碼,
為了解決這些問題,POSIX定義了sigaction函式,它允許用戶在設定信號處理程式時,明確指定他們想要的信號處理語意,sigaction的函式原型如下:
#include<signal.h>
int sigaction(int signo, const struct sigaction *restrict act, struct sigaction *restrict oact);
回傳值:成功回傳0,錯誤回傳-1;
此函式中的act、oact和sigpromask中的set、oset的用法相同,struct sigaction的定義如下:
struct sigaction {
void (*sa_handler) (int);/*信號處理函式地址,或SIG_IGN或SIG_DFL*/
sigset_t sa_mask; /*信號處理程序中,需要阻塞的信號集合*/
int sa_flags; /*信號選項*/
void (*sa_sigaction)(int siginfo_t *,void *);
};
由于sigaction的使用比較復雜,這里可以將其封裝成Signal函式,其呼叫方式與signal相同,
typedef void *Sigfunc(int);
Sigfunc *Signal(int signum, Sigfunc *handler)
{
struct sigaction action, old_action;
action.sa_handler = handler;
sigemptyset(&action.sa_mask);
action.sa_flags |= SA_RESTART;
if (sigaction(signum, &action, &old_action) < 0)
unix_error("Signal error");
return (old_action.sa_handler);
}
Signal的信號處理語意如下:
- 只有這個信號處理程式正在處理的那種型別的信號被阻塞;
- 未處理的信號是不排隊的;
- 只要可能,被中斷的系統呼叫會自動重啟;
- 一旦設定了信號處理程式,它會一直保持,
為了保持一致的信號處理語音,強烈建議,將Signal包裝函式替換掉之前的signal函式,
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/246508.html
標籤:其他
