教程說明
C++高性能網路服務保姆級教程
首發地址
day02 真正的高并發還得看IO多路復用
本節目的
使用epoll實作一個高并發的服務器
從單行程講起
上節從一個基礎的socket服務說起我們實作了一個基本的socket服務器,并留了個思考題
先啟動server,然后啟動一個client,不輸入資料,這個時候在另外一個終端上再啟動一個client,并在第二個client終端中輸入資料,會發生什么呢?
實際操作后,我們會發現,在第二個client輸入后,服務端并沒有回應,直到第一個client也輸入資料完成互動后,第二個client才會有資料回傳,
這是由于服務端accept獲取到第一個client的套接字后,由于第一個client未輸入資料,所以服務端行程會阻塞在等待客戶端資料那一行,
...
int read_num = read(accept_fd, read_msg, 100);
...
所以,第二個client完成三次握手后,連接一直在服務端的全連接佇列中,等待accept獲取處理,
多執行緒,一個執行緒一個連接
后續的client無法得到處理是由于服務端只有一個執行緒,獲取client套接字還有連接通信全在一個執行緒中,
那我們直接開多個執行緒就好了,主執行緒只負責accept獲取客戶端套接字,每來一個連接,我們就新起一個執行緒去處理客戶端和服務端的通信,這樣多個連接之間就不會互相影響了,服務端程式如下:
// per_conn_per_thread_server.cpp
#include <sys/socket.h>
#include <netinet/in.h>
#include <unistd.h>
#include <thread>
#include <arpa/inet.h>
#include <string.h>
#include <cstdio>
#include <errno.h>
void handleConn(int accept_fd) {
char read_msg[100];
int read_num = read(accept_fd, read_msg, 100);
printf("get msg from client: %s\n", read_msg);
int write_num = write(accept_fd, read_msg, read_num);
close(accept_fd);
}
int main() {
int listen_fd = socket(AF_INET, SOCK_STREAM, 0);
struct sockaddr_in server_addr;
bzero(&server_addr, sizeof(server_addr));
server_addr.sin_family = AF_INET;
server_addr.sin_addr.s_addr = inet_addr("127.0.0.1");
server_addr.sin_port = htons(8888);
if (bind(listen_fd, (struct sockaddr *)&server_addr, sizeof(server_addr)) < 0) {
printf("bind err: %s\n", strerror(errno));
close(listen_fd);
return -1;
}
if (listen(listen_fd, 2048) < 0) {
printf("listen err: %s\n", strerror(errno));
close(listen_fd);
return -1;
}
struct sockaddr_in client_addr;
bzero(&client_addr, sizeof(struct sockaddr_in));
socklen_t client_addr_len = sizeof(client_addr);
int accept_fd = 0;
while((accept_fd = accept(listen_fd, (struct sockaddr *)&client_addr, &client_addr_len)) > 0) {
printf("get accept_fd: %d from: %s:%d\n", accept_fd, inet_ntoa(client_addr.sin_addr), ntohs(client_addr.sin_port));
std::thread handleThread(handleConn, accept_fd);
// 將執行緒設定為后臺執行緒,避免阻塞主執行緒
handleThread.detach();
}
}
使用thread庫時,如果使用g++進行編譯需要添加
-lpthread,完整編譯命令:g++ -std=c++11 xxx.cpp -lpthread
看似解決阻塞問題了,但其實這種方案有大缺陷,只要我們稍微加大下客戶端的并發度,就會發現服務端會處理不過來,每來一個連接都創建一個新執行緒,處理完后再銷毀執行緒,這種處理方式成本太大,
IO多路復用和Reactor模型
我們仔細分析下,「per connection per thread」出現性能瓶頸有以下幾個原因:
- 一個系統能同時創建的執行緒數量是有限的,而且執行緒數量越多,占用記憶體也會變多,容易導致OOM,
- 每個連接都用一個新執行緒去處理,處理結束后銷毀對應執行緒,執行緒創建和銷毀都需要較大開銷,
- 一個執行緒當執行時間片用完或者遇到系統呼叫阻塞時,都會讓出CPU,CPU會保留執行緒的現場資訊,然后去執行其他執行緒(這個程序也稱為CPU背景關系切換),所以當執行緒數很多時,CPU的執行緒背景關系切換也會越頻繁,真正用于處理連接通信的時間也會越少,也就是CPU在瞎忙活,
既然是由于并發量高時執行緒太多導致的性能問題,那如果有一種技術,能讓一個執行緒負責N個連接就能完美解決了,偽代碼如下:
class HandleThread {
std::vector<int> handle_fds;
void addFd(int fd) {handle_fds.push_back(fd)};
void work();
}
HandleThread::work() {
for(;;) {
int readyFd = getReadyIOFd();
...
// 對readyFd讀寫處理
...
}
}
auto pool = createThreadPool(4);
int accept_fd = accept(...);
HandleThread thread = pool.getThread();
thread.addFd(accept_fd);
上面代碼大家應該很容易看懂,先創建一個指定執行緒數量的執行緒池,主執行緒獲取到新連接后,丟到執行緒池的一個執行緒去處理,每個執行緒初始化后會執行work函式,work函式是一個while死回圈,里面的getReadyIOFd會阻塞執行緒,直到有可讀可寫的套接字時,才會喚醒執行緒,去進行連接的讀寫,
掃盲點:一般我們講的由于系統呼叫(比如read/write等)導致阻塞,這個時候阻塞的執行緒狀態會被置為掛起,不會占用CPU,所以上面雖然有個while死回圈,但在getReadyIOFd被阻塞了,getReadyIOFd底層也是個系統呼叫(具體實作我們后面會講到),在沒有可讀寫的套接字時執行緒并不會占用CPU,
上面的流程,其實就是大名鼎鼎的IO多路復用和Reactor多執行緒模型了,
epoll登場
這一節我們具體聊聊一個handleThread是如何管理多個套接字的,
IO多路復用的實作模型大家多少聽過一些,我們先比較下常見的select和epoll
select
select簡單理解就是拿一個陣列保存連接套接字,呼叫select時,會將整個陣列拷貝到內核空間中,如果當前陣列中沒有可讀寫的套接字,執行緒被阻塞,
等到陣列中有可讀寫的套接字,或者超時(select可以設定阻塞的超時時間),select呼叫會回傳,然后執行緒遍歷全部陣列,找到可讀寫的套接字,進行讀寫處理,
select存在以下幾個缺點:
- 陣列中的套接字數量有限制,最多1024個,這個數是select代碼中寫死的,具體可看
/usr/include/bits/typesizes.h中有定義, - select回傳后,只是告訴我們這些陣列中有fd就緒了,但卻沒告訴我們具體是哪個fd可讀寫,我們需要輪訓整個資料,才能找到可操作的fd,效率比較低
- 需要維護一個用來存放大量fd的資料結構,這樣會使得用戶空間和內核空間在傳遞該結構時復制開銷大,
epoll
epoll是linux2.6的時候提出的,epoll在內核中維護了一個eventpoll物件,eventpoll包含一個紅黑樹結構的等待佇列wq和一個鏈表結構的就緒佇列rdlist,
新獲取到一個套接字后,將該套接字添加到wq中,等到套接字可讀寫時,作業系統會將該套接字從wq轉到rdlist,然后執行緒直接處理rdlist中的套接字即可,不需要再遍歷全部監聽的套接字了,
與select相比,可以發現有以下幾個優點:
- 沒有套接字數量的限制
- 阻塞回傳后,會明確告知哪些套接字是可以讀寫的,不需要全部輪訓,效率較高
epoll基本使用
因為我們的專案選用epoll,所以下面我們具體講講epoll的使用方法
epoll_create創建一個epoll實體
int epoll_create(int size);
int epoll_create1(int flags);
- size:用來告知內核期望監控的套接字數量,但在2.6.8之后就廢棄了,由系統自動化分配,
- flags: 如果設定為0,和
epoll_create功能相同,可以設定為EPOLL_CLOEXEC, 表示當持有epoll句柄的行程fork出一個子行程時,子行程不會包含該epoll_fd, - 回傳值:成功回傳epoll_fd,失敗回傳-1
epoll_ctl管理監聽的描述符,并注冊要監聽的事件
int epoll_ctl(int epfd, int op, int fd, struct epoll_event* event);
- epfd:
epoll_create創建的epoll_fd - op: 要操作的型別:
a. EPOLL_CTL_ADD :注冊事件
b. EPOLL_CTL_MOD:更改事件
c. EPOLL_CTL_DEL:洗掉事件 - fd: 要操作的檔案描述符
- event: 要注冊的事件型別
typedef union epoll_data
{
void *ptr;
int fd;
uint32_t u32;
uint64_t u64;
} epoll_data_t;
struct epoll_event
{
uint32_t events; /* Epoll events */
epoll_data_t data; /* User data variable */
}
// epoll_event.event表示具體的事件型別,常見有以下幾種:
// EPOLLIN:檔案描述符可讀
// EPOLLOUT:檔案描述符可寫
// EPOLLRDHUP:套接字對端斷開
// EPOLLET:邊緣觸發(后面細講)
epoll_wait等待事件發生,沒有事件時,呼叫者行程會被掛起,等到事件發生/超時后回傳
int epoll_wait(int epfd, struct epoll_event* evlist, int maxevents, int timeout);
- epfd:
epoll_create創建的epoll_fd - evlist: 回傳給用戶空間的可以處理的IO事件陣列,即前面說的就緒佇列
- maxevents:表示一次
epoll_wait最多可以回傳的事件數量 - timeout:
epoll_wait阻塞的超時值,如果設定為-1,表示不超時,如果設定為0,即使沒有IO事件也會立即回傳
epoll有EPOLLLT(水平觸發)和EPOLLET(邊緣觸發)兩種作業模式:
- 水平觸發:只要socket處于可讀狀態(緩沖區有資料)或可寫狀態,無論什么時候進行epoll_wait都會回傳該socket,也就是說我們第一次
epoll_wait回傳后讀了部分資料,在下一次的epoll_wait呼叫還是會回傳之前那個沒讀完資料的socket, - 邊緣觸發:只有套接字的狀態由不可寫到可寫或由不可讀到可讀時,才會觸發
epoll_wait回傳,如果我們第一次epoll_wait回傳中讀了部分資料,如果該套接字沒再收到新資料,那即使該套接字快取區中還有一些資料沒讀,下一次的epoll_wait也不會回傳該套接字了,所以我們需要在第一次讀時通過回圈read的方式把套接字中的資料全讀出來,
邊緣觸發處理起來會比水平觸發比較麻煩,但性能會比水平觸發高,因為減少 epoll 相關系統呼叫次數
講完epoll的使用方法,我們把前面的偽代碼套上epoll的邊緣觸發模式,完整代碼如下:
#include <sys/socket.h>
#include <netinet/in.h>
#include <unistd.h>
#include <thread>
#include <arpa/inet.h>
#include <string.h>
#include <cstdio>
#include <errno.h>
#include <vector>
#include <assert.h>
#include <sys/epoll.h>
#include <fcntl.h>
int setfdNonBlock(int fd) {
int flag = fcntl(fd, F_GETFL, 0);
if (flag == -1) return -1;
flag |= O_NONBLOCK;
if (fcntl(fd, F_SETFL, flag) == -1) return -1;
return 0;
};
void handleConn(int accept_fd) {
char read_msg[100];
char *buf_ptr = read_msg;
int total_read_num = 0;
int read_num = 0;
// 使用的是epollet邊緣觸發模式,需要把套接字快取區中的資料全讀完
do {
read_num = read(accept_fd, buf_ptr, 100);
buf_ptr += read_num;
total_read_num += read_num;
} while(read_num > 0);
printf("get msg from client: %s\n", read_msg);
int write_num = write(accept_fd, read_msg, total_read_num);
close(accept_fd);
}
int listenServer(char *host, int port) {
int listen_fd = socket(AF_INET, SOCK_STREAM, 0);
struct sockaddr_in server_addr;
bzero(&server_addr, sizeof(server_addr));
server_addr.sin_family = AF_INET;
server_addr.sin_addr.s_addr = inet_addr("127.0.0.1");
server_addr.sin_port = htons(8888);
if (bind(listen_fd, (struct sockaddr *)&server_addr, sizeof(server_addr)) < 0) {
printf("bind err: %s\n", strerror(errno));
close(listen_fd);
return -1;
}
if (listen(listen_fd, 2048) < 0) {
printf("listen err: %s\n", strerror(errno));
close(listen_fd);
return -1;
}
return listen_fd;
}
const int EPOLLWAIT_TIME = 10000;
const int EVENTSMAXNUM = 4096;
class HandleThread {
public:
HandleThread()
: epoll_fd_(epoll_create1(EPOLL_CLOEXEC)),
epoll_events_(EVENTSMAXNUM),
thread_(std::bind(&HandleThread::work, this)) {
assert(epoll_fd_ > 0);
thread_.detach();
}
~HandleThread() {
close(epoll_fd_);
}
// 執行緒實際運行函式
void work();
// 添加監聽套接字
void addFd(int fd);
// 不再監聽指定套接字
void rmFd(int fd);
private:
int epoll_fd_;
std::vector<epoll_event>epoll_events_;
std::thread thread_;
};
void HandleThread::work() {
for(;;) {
int event_count = epoll_wait(epoll_fd_, &*epoll_events_.begin(), epoll_events_.size(), EPOLLWAIT_TIME);
if (event_count < 0) {
perror("epoll wait error");
continue;
}
for (int i = 0; i < event_count; i++) {
epoll_event cur_event = epoll_events_[i];
int fd = cur_event.data.fd;
// 不再監聽fd,從epoll中去掉
rmFd(fd);
// 處理連接讀寫
handleConn(fd);
}
}
}
void HandleThread::addFd(int fd) {
epoll_event event;
event.data.fd = fd;
// 只監聽讀事件
event.events = EPOLLIN | EPOLLET;
if (epoll_ctl(epoll_fd_, EPOLL_CTL_ADD, fd, &event) < 0) {
perror("epoll_add error");
}
}
void HandleThread::rmFd(int fd) {
epoll_event event;
event.data.fd = fd;
event.events = EPOLLIN | EPOLLET;
if (epoll_ctl(epoll_fd_, EPOLL_CTL_DEL, fd, &event) < 0) {
perror("epoll_del error");
}
}
typedef std::shared_ptr<HandleThread> SP_HandleThread;
class HandleThreadPool {
public:
HandleThreadPool(int thread_nums) : thread_nums_(thread_nums), next_thread_idx_(0) {
for (int i = 0; i < thread_nums; i++) {
SP_HandleThread t (new HandleThread());
thread_pool_.push_back(t);
}
}
SP_HandleThread getThread();
private:
int thread_nums_;
int next_thread_idx_;
std::vector<SP_HandleThread> thread_pool_;
};
// 從執行緒池中獲取一個執行緒
SP_HandleThread HandleThreadPool::getThread() {
SP_HandleThread t = thread_pool_[next_thread_idx_];
next_thread_idx_ = (next_thread_idx_ + 1) % thread_nums_;
return t;
}
int main() {
int listen_fd = listenServer("127.0.0.1", 8888);
// 創建執行緒池
HandleThreadPool pool(4);
// 等待1秒
sleep(1);
struct sockaddr_in client_addr;
bzero(&client_addr, sizeof(struct sockaddr_in));
socklen_t client_addr_len = sizeof(client_addr);
int accept_fd = 0;
while((accept_fd = accept(listen_fd, (struct sockaddr *)&client_addr, &client_addr_len)) > 0) {
printf("get accept_fd: %d from: %s:%d\n", accept_fd, inet_ntoa(client_addr.sin_addr), ntohs(client_addr.sin_port));
// 將fd設定為非阻塞 ?
setfdNonBlock(accept_fd);
// 從pool中獲取一個執行緒處理連接
SP_HandleThread t = pool.getThread();
t->addFd(accept_fd);
}
}
代碼比較長,但不難,大家可以fork下來慢慢看,
使用了智能指標,避免忘記回收堆上的資源,
大家可能會發現代碼有兩次注釋添加了"?",第一處是在創建執行緒池后,sleep了1秒,這個當成本節的思考題,大家可以先思考,并想想有沒有什么更好的解決辦法?
第二處是在獲取到accept_fd后,將fd設定為非阻塞了,下面我們展開具體講講,
非阻塞與IO多路復用更搭
首先我們先聊聊阻塞IO呼叫和非阻塞IO呼叫的區別,
阻塞IO呼叫:行程在呼叫IO操作時,如果沒有資料可讀或緩沖區沒有空閑空間可寫,導致IO操作未完成,行程被阻塞掛起,后續操作將無法執行,比如下面代碼,如果客戶端建立連接后,一直不發送資料,那服務端執行就會阻塞在read呼叫,后面的printf無法被執行到,
int accept_fd = accept(...);
char read_msg[100];
int read_num = read(accept_fd, read_msg, 100);
printf("i am a log\n");
小提示:上面的代碼即使客戶端只發了1個位元組的資料,服務端
read呼叫也會回傳,并不是要等到讀滿100個位元組才會回傳,
非阻塞IO呼叫: 行程在呼叫IO操作時,即使IO操作未完成,該IO呼叫也會立刻回傳,之后行程可以進行后續操作,比如下面代碼,將accept_fd設定為非阻塞后,再呼叫read,這時即使客戶端沒有發資料,服務端也不會一直卡在read呼叫上,后面的printf能順利列印出來,
int accept_fd = accept(...);
// 將fd設定為非阻塞
setfdNonBlock(accept_fd);
char read_msg[100];
int read_num = read(accept_fd, read_msg, 100);
printf("i am a log\n");
下面我們再說下為什么IO多路復用要搭配非阻塞IO?
在前面,我們使用epoll實作了一個執行緒管理多個套接字,當某個套接字有讀寫事件時,epoll_wait呼叫回傳,告訴我們哪些套接字能讀,但并不會告訴我們某個套接字上有多少資料可讀,
- 使用非阻塞IO處理方式:我們只要回圈的read,直到讀完全部的資料即可(read回傳0),
- 使用阻塞IO處理方式:每次只能呼叫一次read,因為我們并不知道下一次回圈中還有沒有資料可讀,如果沒資料就會阻塞整個行程了,所以只能等待下一次的
epoll_wait回傳了,這對于水平觸發還可行,但對于邊緣觸發就不行了,因為我們不知道這個套接字還會不會有新資料寫入,如果對端不再寫入新資料,那緩沖區中剩下的資料就再也讀不到了,
完整原始碼已上傳到https://github.com/lzs123/CProxy-tutorial,歡迎fork and star!
參考文章
如果這篇文章說不清epoll的本質,那就過來掐死我吧!
寫在最后
如果本文對你有用,點個贊再走吧!或者關注我,我會帶來更多優質的內容,

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/465939.html
標籤:C++
上一篇:const關鍵字:可改不可改?
