select，poll，epoll的區別以及使用方法-有解無憂

I/O多路復用是指：通過一種機制，可以監視多個描述符，一旦某個描述符就緒（一般是讀就緒或者寫就緒），能夠通知程式進行相應的讀寫操作，

原生socket客戶端在與服務端建立連接時，即服務端呼叫accept方法時是阻塞的，同時服務端和客戶端在收發資料(呼叫recv、send、sendall)時也是阻塞的，原生socket服務端在同一時刻只能處理一個客戶端請求，即服務端不能同時與多個客戶端進行通信，實作并發，導致服務端資源閑置(此時服務端只占據 I/O，CPU空閑)，

如果我們的需求是要讓多個客戶端連接至服務器端，而且服務器端需要處理來自多個客戶端請求，很明顯，原生socket實作不了這種需求，此時我們使用I/O多路復用機制就可以實作這種需求，可以同時監聽多個檔案描述符，一旦描述符就緒，能夠通知程式進行相應的讀寫操作，

linux中的IO多路復用

(1)select

select最早于1983年出現在4.2BSD中，它通過一個select()系統呼叫來監視多個檔案描述符的陣列，當select()回傳后，該陣列中就緒的檔案描述符便會被內核修改標志位，使得行程可以獲得這些檔案描述符從而進行后續的讀寫操作，

select目前幾乎在所有的平臺上支持，其良好跨平臺支持也是它的一個優點，事實上從現在看來，這也是它所剩不多的優點之一，

select的一個缺點在于單個行程能夠監視的檔案描述符的數量存在最大限制，在Linux上一般為1024，不過可以通過修改宏定義甚至重新編譯內核的方式提升這一限制，

另外，select()所維護的存盤大量檔案描述符的資料結構，隨著檔案描述符數量的增大，其復制的開銷也線性增長，同時，由于網路回應時間的延遲使得大量TCP連接處于非活躍狀態，但呼叫select()會對所有socket進行一次線性掃描，所以這也浪費了一定的開銷，

(2)poll

poll在1986年誕生于System V Release 3，它和select在本質上沒有多大差別，但是poll沒有最大檔案描述符數量的限制，

poll和select同樣存在一個缺點就是，包含大量檔案描述符的陣列被整體復制于用戶態和內核的地址空間之間，而不論這些檔案描述符是否就緒，它的開銷隨著檔案描述符數量的增加而線性增大，

另外，select()和poll()將就緒的檔案描述符告訴行程后，如果行程沒有對其進行IO操作，那么下次呼叫select()和poll()的時候將再次報告這些檔案描述符，所以它們一般不會丟失就緒的訊息，這種方式稱為水平觸發（Level Triggered），

(3)epoll

直到Linux2.6才出現了由內核直接支持的實作方法，那就是epoll，它幾乎具備了之前所說的一切優點，被公認為Linux2.6下性能最好的多路I/O就緒通知方法，

epoll可以同時支持水平觸發和邊緣觸發（Edge Triggered，只告訴行程哪些檔案描述符剛剛變為就緒狀態，它只說一遍，如果我們沒有采取行動，那么它將不會再次告知，這種方式稱為邊緣觸發），理論上邊緣觸發的性能要更高一些，但是代碼實作相當復雜，

epoll同樣只告知那些就緒的檔案描述符，而且當我們呼叫epoll_wait()獲得就緒檔案描述符時，回傳的不是實際的描述符，而是一個代表就緒描述符數量的值，你只需要去epoll指定的一個陣列中依次取得相應數量的檔案描述符即可，這里也使用了記憶體映射（mmap）技術，這樣便徹底省掉了這些檔案描述符在系統呼叫時復制的開銷，

另一個本質的改進在于epoll采用基于事件的就緒通知方式，在select/poll 中，行程只有在呼叫一定的方法后，內核才對所有監視的檔案描述符進行掃描，而epoll事先通過epoll_ctl()來注冊一個檔案描述符，一旦基于某個檔案描述符就緒時，內核會采用類似callback的回呼機制，迅速激活這個檔案描述符，當行程呼叫epoll_wait()時便得到通知，

總結：

select

select的幾大缺點：

（1）每次呼叫select，都需要把fd集合從用戶態拷貝到內核態，這個開銷在fd很多時會很大

（2）同時每次呼叫select都需要在內核遍歷傳遞進來的所有fd，這個開銷在fd很多時也很大

（3）select支持的檔案描述符數量太小了，默認是1024

poll

poll的機制與select類似，與select在本質上沒有多大差別，管理多個描述符也是進行輪詢，根據描述符的狀態進行處理，但是poll沒有最大檔案描述符數量的限制，poll和select同樣存在一個缺點就是，包含大量檔案描述符的陣列被整體復制于用戶態和內核的地址空間之間，而不論這些檔案描述符是否就緒，它的開銷隨著檔案描述符數量的增加而線性增大，

epoll

epoll是在2.6內核中提出的，是之前的select和poll的增強版本，相對于select和poll來說，epoll更加靈活，沒有描述符限制，epoll使用一個檔案描述符管理多個描述符，將用戶關系的檔案描述符的事件存放到內核的一個事件表中，這樣在用戶空間和內核空間的copy只需一次，

最終呼叫epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);函式等待事件到來，回傳值是需要處理的事件數目，events表示要處理的事件集合，

一句話總結

（1）select，poll實作需要自己不斷輪詢所有fd集合，直到設備就緒，期間可能要睡眠和喚醒多次交替，而epoll其實也需要呼叫epoll_wait不斷輪詢就緒鏈表，期間也可能多次睡眠和喚醒交替，但是它是設備就緒時，呼叫回呼函式，把就緒fd放入就緒鏈表中，并喚醒在epoll_wait中進入睡眠的行程，雖然都要睡眠和交替，但是select和poll在“醒著”的時候要遍歷整個fd集合，而epoll在“醒著”的時候只要判斷一下就緒鏈表是否為空就行了，這節省了大量的CPU時間，這就是回呼機制帶來的性能提升，

（2）select，poll每次呼叫都要把fd集合從用戶態往內核態拷貝一次，并且要把current往設備等待佇列中掛一次，而epoll只要一次拷貝，而且把current往等待佇列上掛也只掛一次（在epoll_wait的開始，注意這里的等待佇列并不是設備等待佇列，只是一個epoll內部定義的等待佇列），這也能節省不少的開銷，

epoll的使用方法

epoll的介面非常簡單，一共就三個函式，

1，epoll_create

/*
size：在 Linux最新的一些內核版本的實作中，這個 size引數沒有任何意義，
回傳值：回傳值為一個檔案描述符，作為后面兩個函式的引數
*/
int epoll_create(int size)

此函式可以在內核中創建一個內核事件表，通過回傳的內核事件表來管理

2，epoll_ctl

/*
epfd：操作內核時間表的檔案描述符，即epoll_create函式的回傳值
op：操作內核時間表的方式
	EPOLL_CTL_ADD(向內核時間表添加檔案描述符，即注冊);
	EPOLL_CTL_MOD（修改內核事件表事件）;
	EPOLL_CTL_DEL （洗掉內核事件表中的事件）;
fd：操作的檔案描述符
event：指向struct epoll_event的指標
*/
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event)

poll的事件注冊函式，epoll_ctl向 epoll物件中添加、修改或者洗掉感興趣的事件，回傳0表示成功，否則回傳–1，此時需要根據errno錯誤碼判斷錯誤型別，

event結構

struct epoll_event
{
    /*
    儲存用戶感興趣的事情和就緒事件,
    events可以是以下幾個宏的集合：
    EPOLLIN ：表示對應的檔案描述符可以讀（包括對端SOCKET正常關閉）；
    EPOLLOUT：表示對應的檔案描述符可以寫；
    EPOLLPRI：表示對應的檔案描述符有緊急的資料可讀（這里應該表示有帶外資料到來）；
    EPOLLERR：表示對應的檔案描述符發生錯誤；
    EPOLLHUP：表示對應的檔案描述符被掛斷；
    EPOLLET： 將EPOLL設為邊緣觸發(Edge Triggered)模式，這是相對于水平觸發(Level Triggered)來說的，
    EPOLLONESHOT：只監聽一次事件，當監聽完這次事件之后，如果還需要繼續監聽這個socket的話，需要再次把這個socket加入到EPOLL佇列里
    */
    uint32_t events; 
    epoll_data_t data; //聯合體最重要的就是fd，即要操作的檔案描述符
};
 
typedef union epoll_data
{
    void *ptr;
    int fd;
    _uint32_t u32;
    _uint64_t u64;
}epoll_data_t;

3，epoll_wait

/*
epfd：同上面函式
events：用于接收內核回傳的就緒事件的陣列
maxevents：用戶最多能處理的事件個數
等待I/O的超時值（后面的編程設為-1，表示永不超時），單位為ms
回傳值，指的是就緒事件的個數
*/
int epoll_wait(int epfd, struct epoll_event events, int maxevents, int timeout)

等待事件的產生，類似于select()呼叫，引數events用來從內核得到事件的集合，maxevents告之內核這個events有多大，這個 maxevents的值不能大于創建epoll_create()時的size，引數timeout是超時時間（毫秒，0會立即回傳，-1將不確定，也有說法說是永久阻塞），該函式回傳需要處理的事件數目，如回傳0表示已超時，如果回傳–1，則表示出現錯誤，需要檢查 errno錯誤碼判斷錯誤型別，

下面通過一個echo回射服務器的客戶端和服務端案例介紹epoll的使用方法

服務端事件poll

    int epollFd;
    struct epoll_event events[MAX_EVENTS];
    int ret;
    char buf[MAXSIZE];
    memset(buf,0,MAXSIZE);
    //創建一個epoll描述符,通過這個描述管理多個描述符
    epollFd = epoll_create(FDSIZE);
    //添加監聽描述符事件
    add_event(epollFd,listenFd,EPOLLIN);
    while(1){
        //獲取已經準備好的描述符事件，阻塞
        ret = epoll_wait(epollFd, events, MAX_EVENTS,-1);
        //處理事件，ret是發生的事件個數
        handle_events(epollFd,events,ret,listenFd,buf);
    }
    close(epollFd);

客戶端事件poll

    int                 sockfd;
    struct sockaddr_in  servaddr;
    sockfd = socket(AF_INET,SOCK_STREAM, IPPROTO_TCP);
    bzero(&servaddr,sizeof(servaddr));
    servaddr.sin_family = AF_INET;
    servaddr.sin_port = htons(SERV_PORT);
    servaddr.sin_addr.s_addr = inet_addr(IPADDRESS);
    printf("start\n");
    if(connect(sockfd,(struct sockaddr*)&servaddr, sizeof(sockaddr_in)) < 0){
        perror("connect err: ");
        return 0;
    }
    else{
        printf("connect succ\n");
    }
    //處理連接
    handle_connection(sockfd);
    close(sockfd);
    return 0;

程式運行結果

客戶端

./cli
start
connect succ
cli hello
epollfd 4, rdfd 0, sockfd 3, read 10
epollfd 4, wrfd 3, sockfd 3, write 10
epollfd 4, rdfd 3, sockfd 3, read 10
cli hello
epollfd 4, wrfd 1, sockfd 3, write 10
cli over
epollfd 4, rdfd 0, sockfd 3, read 9
epollfd 4, wrfd 3, sockfd 3, write 9
epollfd 4, rdfd 3, sockfd 3, read 9
cli over
epollfd 4, wrfd 1, sockfd 3, write 9
^C

服務端

./srv accept a new client: 127.0.0.1:37098, fd = 5read fd=5, num read=10read message is : cli hellowrite fd=5, num write=10read fd=5, num read=9read message is : cli overwrite fd=5, num write=9read fd=5, num read=0client close.^C

本文簡單總結了select，poll，epoll的使用方法以及各自的優劣勢，以及寫了一個epoll的demo供參考，詳細的運行機制參考文章，

程式源代碼詳見公眾號 xutopia77 的文章《select，poll，epoll的區別以及使用方法》

轉載請註明出處，本文鏈接：https://www.uj5u.com/houduan/412831.html

標籤：C++

上一篇：【C++ Primer Plus】編程練習答案——第18章

下一篇：C++ 從&到&&