Nginx 以其高性能,穩定性,豐富的功能,簡單的配置和低資源消耗而聞名,本文從底層原理分析 Nginx 為什么這么快!
Nginx 的行程模型
Nginx 服務器,正常運行程序中:
-
多行程:一個 Master 行程、多個 Worker 行程,Java面試寶典PDF完整版
-
Master 行程:管理 Worker 行程,對外介面:接收外部的操作(信號);對內轉發:根據外部的操作的不同,通過信號管理 Worker;監控:監控 Worker 行程的運行狀態,Worker 行程例外終止后,自動重啟 Worker 行程,
-
Worker 行程:所有 Worker 行程都是平等的,實際處理:網路請求,由 Worker 行程處理,Worker 行程數量:在 nginx.conf 中配置,一般設定為核心數,充分利用 CPU 資源,同時,避免行程數量過多,避免行程競爭 CPU 資源,增加背景關系切換的損耗,
思考:
-
請求是連接到 Nginx,Master 行程負責處理和轉發?
-
如何選定哪個 Worker 行程處理請求?請求的處理結果,是否還要經過 Master 行程?
HTTP 連接建立和請求處理程序
HTTP 連接建立和請求處理程序如下:
-
Nginx 啟動時,Master 行程,加載組態檔,
-
Master 行程,初始化監聽的 Socket,
-
Master 行程,Fork 出多個 Worker 行程,
-
Worker 行程,競爭新的連接,獲勝方通過三次握手,建立 Socket 連接,并處理請求,
Nginx 高性能、高并發
Nginx 為什么擁有高性能并且能夠支撐高并發?
-
Nginx 采用多行程+異步非阻塞方式(IO 多路復用 Epoll),
-
請求的完整程序:建立連接→讀取請求→決議請求→處理請求→回應請求,
-
請求的完整程序對應到底層就是:讀寫 Socket 事件,
Nginx 的事件處理模型
Request:Nginx 中 HTTP 請求,
基本的 HTTP Web Server 作業模式:
-
接收請求:逐行讀取請求行和請求頭,判斷段有請求體后,讀取請求體,
-
處理請求,
-
回傳回應:根據處理結果,生成相應的 HTTP 請求(回應行、回應頭、回應體),
Nginx 也是這個套路,整體流程一致:
模塊化體系結構
Nginx 的模塊根據其功能基本上可以分為以下幾種型別:
①event module:搭建了獨立于作業系統的事件處理機制的框架,及提供了各具體事件的處理,包括 ngx_events_module,ngx_event_core_module 和 ngx_epoll_module 等,
Nginx 具體使用何種事件處理模塊,這依賴于具體的作業系統和編譯選項,
②phase handler:此型別的模塊也被直接稱為 handler 模塊,主要負責處理客戶端請求并產生待回應內容,比如 ngx_http_static_module 模塊,負責客戶端的靜態頁面請求處理并將對應的磁盤檔案準備為回應內容輸出,
③output filter:也稱為 filter 模塊,主要是負責對輸出的內容進行處理,可以對輸出進行修改,
例如,可以實作對輸出的所有 html 頁面增加預定義的 footbar 一類的作業,或者對輸出的圖片的 URL 進行替換之類的作業,
④upstream:upstream 模塊實作反向代理的功能,將真正的請求轉發到后端服務器上,并從后端服務器上讀取回應,發回客戶端,
upstream 模塊是一種特殊的 handler,只不過回應內容不是真正由自己產生的,而是從后端服務器上讀取的,
⑤load-balancer:負載均衡模塊,實作特定的演算法,在眾多的后端服務器中,選擇一個服務器出來作為某個請求的轉發服務器,
常見問題剖析
Nginx vs Apache
Nginx:
-
IO 多路復用,Epoll(freebsd 上是 kqueue)
-
高性能
-
高并發
-
占用系統資源少
Apache:
-
阻塞+多行程/多執行緒
-
更穩定,Bug 少
-
模塊更豐富
參考文章:
www.oschina.net/translate/n… www.zhihu.com/question/19…
Nginx 最大連接數
基礎背景:
-
Nginx 是多行程模型,Worker 行程用于處理請求,
-
單個行程的連接數(檔案描述符 fd),有上限(nofile):ulimit -n,
-
Nginx 上配置單個 Worker 行程的最大連接數:worker_connections 上限為 nofile,
-
Nginx 上配置 Worker 行程的數量:worker_processes,
因此,Nginx 的最大連接數:
-
Nginx 的最大連接數:Worker 行程數量 x 單個 Worker 行程的最大連接數,
-
上面是 Nginx 作為通用服務器時,最大的連接數,
-
Nginx 作為反向代理服務器時,能夠服務的最大連接數:(Worker 行程數量 x 單個 Worker 行程的最大連接數)/ 2,
-
Nginx 反向代理時,會建立 Client 的連接和后端 Web Server 的連接,占用 2 個連接,
思考:
-
每打開一個 Socket 占用一個 fd?
-
為什么,一個行程能夠打開的 fd 數量有限制?
HTTP 請求和回應
HTTP 請求:
-
請求行:method、uri、http version
-
請求頭
-
請求體
HTTP 回應:
-
回應行:http version、status code
-
回應頭
-
回應體
IO 模型
處理多個請求時,可以采用:IO 多路復用或者阻塞 IO+多執行緒:
-
IO 多路復用:一個執行緒,跟蹤多個 Socket 狀態,哪個就緒,就讀寫哪個,
-
阻塞 IO+多執行緒:每一個請求,新建一個服務執行緒,
IO 多路復用和多執行緒的適用場景?
-
IO 多路復用:單個連接的請求處理速度沒有優勢,
-
大并發量:只使用一個執行緒,處理大量的并發請求,降低背景關系環境切換損耗,也不需要考慮并發問題,相對可以處理更多的請求,
-
消耗更少的系統資源(不需要執行緒調度開銷),
-
適用于長連接的情況(多執行緒模式長連接容易造成執行緒過多,造成頻繁調度),
-
阻塞 IO +多執行緒:實作簡單,可以不依賴系統呼叫,
-
每個執行緒,都需要時間和空間,
-
執行緒數量增長時,執行緒調度開銷指數增長,
select/poll 和 epoll 比較如下:
詳細內容,參考:
www.cnblogs.com/wiessharlin…
select/poll 系統呼叫:
// select 系統呼叫
int select(int maxfdp,fd_set *readfds,fd_set *writefds,fd_set *errorfds,struct timeval *timeout);
// poll 系統呼叫
int poll(struct pollfd fds[], nfds_t nfds, int timeout);
select:
-
查詢 fd_set 中,是否有就緒的 fd,可以設定一個超時時間,當有 fd (File descripter) 就緒或超時回傳,
-
fd_set 是一個位集合,大小是在編譯內核時的常量,默認大小為 1024,
-
特點:連接數限制,fd_set 可表示的 fd 數量太小了;線性掃描:判斷 fd 是否就緒,需要遍歷一邊 fd_set;資料復制:用戶空間和內核空間,復制連接就緒狀態資訊,
poll:
-
解決了連接數限制:poll 中將 select 中的 fd_set 替換成了一個 pollfd 陣列,解決 fd 數量過小的問題,
-
資料復制:用戶空間和內核空間,復制連接就緒狀態資訊,
epoll,event 事件驅動:
-
事件機制:避免線性掃描,為每個 fd,注冊一個監聽事件,fd 變更為就緒時,將 fd 添加到就緒鏈表,
-
fd 數量:無限制(OS 級別的限制,單個行程能打開多少個 fd),
select,poll,epoll:
-
I/O 多路復用的機制,
-
I/O 多路復用就通過一種機制,可以監視多個描述符,一旦某個描述符就緒(一般是讀就緒或者寫就緒),能夠通知程式進行相應的讀寫操作;監視多個檔案描述符,
-
但 select,poll,epoll 本質上都是同步 I/O:用戶行程負責讀寫(從內核空間拷貝到用戶空間),讀寫程序中,用戶行程是阻塞的;異步 IO,無需用戶行程負責讀寫,異步 IO,會負責從內核空間拷貝到用戶空間,
Nginx 的并發處理能力
關于 Nginx 的并發處理能力:并發連接數,一般優化后,峰值能保持在 1~3w 左右,(記憶體和 CPU 核心數不同,會有進一步優化空間),Java面試寶典PDF完整版
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/253408.html
標籤:其他
上一篇:JVM(二)記憶體區域
下一篇:ES入門及安裝軟體
