IO操作根據設備型別一般分為記憶體IO,網路IO,和磁盤IO，其中記憶體IO的速度大大快于后兩者，計算機的性能瓶頸一般不在于記憶體IO. 盡管網路IO可通過購買獨享帶寬和高速網卡來提升速度，可以使用RAID磁盤陣列來提升磁盤IO的速度，但是由于IO操作都是由系統內核呼叫來完成，而系統呼叫是通過cpu來調度的，而cpu的速度遠遠快于IO操作，導致會浪費cpu的寶貴時間來等待慢速的IO操作，為了讓cpu和慢速的IO設備更好的協調作業，減少CPU在IO呼叫上的消耗，逐漸發展出各種IO模型，

IO模型

IO步驟

I/O主要為：網路IO（本質是socket檔案讀取）、磁盤IO
每次IO，對于一次IO訪問，資料會先被拷貝到內核的緩沖區中，然后才會從內核的緩沖區拷貝到應用程式的地址空間，需要經歷兩個階段：

第一步：將資料從檔案先加載至內核記憶體空間（緩沖區），等待資料準備完成，時間較長
第二步：將資料從內核緩沖區復制到用戶空間的行程的記憶體中，時間較短

阻塞/非阻塞和同步/異步

IO模型總是離不開阻塞/非阻塞、同步/異步這些概念，

阻塞/非阻塞：阻塞和非阻塞是對呼叫方執行緒狀態的描述，如果一次IO程序中，呼叫方執行緒需要阻塞執行緒等待資料的到達，那么說這次IO是阻塞式IO，
同步/異步：同步和異步是對呼叫方獲取資料方式的描述，如果呼叫方主動去查詢并復制資料，那么稱IO是同步的，如果是作業系統在資料準備完成(復制到用戶快取區)之后告訴呼叫方有資料準備好了，那么稱IO是異步的，

IO模型分類

發起系統呼叫的是運行在系統上的某個應用的行程、物件是磁盤上的資料、獲取資料需要通過I/O、整個程序就是應用等待獲取磁盤資料，針對整個程序中應用行程的狀態不同，可以分為：同步阻塞型，同步非阻塞型，同步復用型，信號驅動型，異步，

同步阻塞型IO

類比：老李去火車站買票，排隊三天買到一張退票，耗費：在車站吃喝拉撒睡3天，其他事一件沒干，

同步阻塞IO模型是最簡單的IO模型，用戶執行緒在內核進行IO操作時被阻塞，等到資料讀取完成之后在繼續處理后續邏輯，其步驟如下所示（以read()介面為例）：

read(file, tmp_buf, len);

用戶程式需要讀取資料，呼叫read方法，把讀取資料的指令交給CPU執行，
CPU發出指令給DMA，告訴DMA需要讀取磁盤的哪些資料，然后回傳，執行緒進入阻塞狀態
DMA向磁盤控制器發出IO請求，告訴磁盤控制器需要讀取哪些資料，然后回傳；
磁盤控制器收到IO請求之后，把資料讀取到磁盤快取區，當磁盤快取讀取完成之后，中斷DMA；
DMA收到磁盤的中斷信號，將磁盤快取區的資料讀取到PageCache快取區，然后中斷CPU；
CPU回應DMA中斷信號，知道資料讀取完成，然后將PageCache快取區中的資料讀取到用戶快取中；
用戶程式從記憶體中讀取到資料，可以繼續執行后續邏輯，

file

同步阻塞IO的優缺點

優點：程式簡單，在阻塞等待資料期間行程/執行緒掛起，基本不會占用CPU資源，
缺點：每個連接需要獨立的行程/執行緒單獨處理，當并發請求量大時為了維護程式，記憶體、執行緒切換開銷較大，這種模型在實際生產中很少使用，

同步非阻塞型IO

類比：老李去火車站買票，隔12小時去火車站問有沒有退票，三天后買到一張票，耗費：往返車站6次，路上6小時，其他時間做了好多事，

非阻塞IO就是當呼叫方發起讀取資料申請時，如果內核資料沒有準備好會即刻告訴呼叫方，不需要呼叫方執行緒阻塞等待，

以recvfrom方法為例，呼叫方呼叫recvfrom讀取資料時，如果該緩沖區沒有資料的話，就會直接回傳一個EWOULDBLOCK錯誤，不會讓應用一直等待中，在沒有資料的時候會即刻回傳錯誤標識，那也意味著如果應用要讀取資料就需要不斷的呼叫recvfrom請求，直到讀取到它資料要的資料為止，其讀取步驟如下所示：

呼叫方呼叫recvfrom方法嘗試獲取資料；
如果recvfrom方法回傳EWOULDBLOCK錯誤，執行步驟1；如果revifrom方法發現快取區有資料，那么執行步驟3；
CPU將PageCache快取區中的資料讀取到用戶快取中；
用戶程式從記憶體中讀取到資料，可以繼續執行后續邏輯，

file

種方式在編程中對socket設定O_NONBLOCK即可，但此方式僅僅針對網路IO有效，對磁盤IO并沒有作用，因為本地檔案IO默認是阻塞，我們所說的網路IO的阻塞是因為網路IO有無限阻塞的可能，而本地檔案除非是被鎖住，否則是不可能無限阻塞的，因此只有鎖這種情況下，O_NONBLOCK才會有作用，而且，磁盤IO時要么資料在內核緩沖區中直接可以回傳，要么需要呼叫物理設備去讀取，這時候行程的其他作業都需要等待，因此，后續的IO復用和信號驅動IO對檔案IO也是沒有意義的，

IO復用模型

IO復用，也叫多路IO就緒通知，這是一種行程預先告知內核的能力，讓內核發現行程指定的一個或多個IO條件就緒了，就通知行程，使得一個行程能在一連串的事件上等待，IO復用的實作方式目前主要有select、poll和epoll，

select/poll

類比：老李去火車站買票，委托黃牛，然后每隔6小時電話黃牛詢問，黃牛三天內買到票，然后老李去火車站交錢領票，耗費：往返車站2次，路上2小時，黃牛手續費100元，打電話17次

select和poll的原理基本相同：

注冊待偵聽的fd(這里的fd創建時最好使用非阻塞)
每次呼叫都去檢查這些fd的狀態，當有一個或者多個fd就緒的時候回傳
回傳結果中包括已就緒和未就緒的fd

相比select，poll解決了單個行程能夠打開的檔案描述符數量有限制這個問題：select受限于FD_SIZE的限制，如果修改則需要修改這個宏重新編譯內核；而poll通過一個pollfd陣列向內核傳遞需要關注的事件，避開了檔案描述符數量限制，

此外，select和poll共同具有的一個很大的缺點就是包含大量fd的陣列被整體復制于用戶態和內核態地址空間之間，開銷會隨著fd數量增多而線性增大，

epoll

老李去火車站買票，委托黃牛，黃牛買到后即通知老李去領，然后老李去火車站交錢領票，耗費：往返車站2次，路上2小時，黃牛手續費100元，無需打電話

epoll是poll的一種改進：

基于事件驅動的方式，避免了每次都要把所有fd都掃描一遍，
epoll_wait只回傳就緒的fd，
epoll使用nmap記憶體映射技術避免了記憶體復制的開銷，
epoll的fd數量上限是作業系統的最大檔案句柄數目,這個數目一般和記憶體有關，通常遠大于1024，

目前，epoll是Linux2.6下最高效的IO復用方式，也是Nginx、Node的IO實作方式，而在freeBSD下，kqueue是另一種類似于epoll的IO復用方式，

此外，對于IO復用還有一個水平觸發和邊緣觸發的概念：

水平觸發：當就緒的fd未被用戶行程處理后，下一次查詢依舊會回傳，這是select和poll的觸發方式，
邊緣觸發：無論就緒的fd是否被處理，下一次不再回傳，理論上性能更高，但是實作相當復雜，并且任何意外的丟失事件都會造成請求處理錯誤，epoll默認使用水平觸發，通過相應選項可以使用邊緣觸發，

由于同步非阻塞方式需要不斷主動輪詢，輪詢占據了很大一部分程序，輪詢會消耗大量的CPU時間，而 “后臺” 可能有多個任務在同時進行，人們就想到了回圈查詢多個任務的完成狀態，只要有任何一個任務完成，就去處理它，如果輪詢不是行程的用戶態，而是有人幫忙就好了，那么這就是所謂的 “IO 多路復用”，UNIX/Linux 下的 select、poll、epoll 就是干這個的（epoll 比 poll、select 效率高，做的事情是一樣的），

IO多路復用有兩個特別的系統呼叫select、poll、epoll函式，select呼叫是內核級別的，select輪詢相對非阻塞的輪詢的區別在于---前者可以等待多個socket，能實作同時對多個IO埠進行監聽，當其中任何一個socket的資料準好了，就能回傳進行可讀，然后行程再進行recvform系統呼叫，將資料由內核拷貝到用戶行程，當然這個程序是阻塞的，select或poll呼叫之后，會阻塞行程，與blocking IO阻塞不同在于，此時的select不是等到socket資料全部到達再處理, 而是有了一部分資料就會呼叫用戶行程來處理，如何知道有一部分資料到達了呢？監視的事情交給了內核，內核負責資料到達的處理，也可以理解為"非阻塞"吧，

I/O復用模型會用到select、poll、epoll函式，這幾個函式也會使行程阻塞，但是和阻塞I/O所不同的的，這兩個函式可以同時阻塞多個I/O操作，而且可以同時對多個讀操作，多個寫操作的I/O函式進行檢測，直到有資料可讀或可寫時（注意不是全部資料可讀或可寫），才真正呼叫I/O操作函式，

對于多路復用，也就是輪詢多個socket，多路復用既然可以處理多個IO，也就帶來了新的問題，多個IO之間的順序變得不確定了，當然也可以針對不同的編號，具體流程，如下圖所示：

信號驅動模型

類比：老李去火車站買票，給售票員留下電話，有票后，售票員電話通知老李，然后老李去火車站交錢領票，耗費：往返車站2次，路上2小時，免黃牛費100元，無需打電話

信號驅動IO模型，應用行程告訴內核：當資料報準備好的時候，給我發送一個信號，對SIGIO信號進行捕捉，并且呼叫我的信號處理函式來獲取資料報，流程如下：

開啟套接字信號驅動IO功能；
系統呼叫sigaction執行信號處理函式（非阻塞，立刻回傳），告訴系統資料就緒式呼叫哪個函式；
資料就緒，生成sigio信號，通過信號回呼通知應用來讀取資料，

此種io方式存在的一個很大的問題：Linux中信號佇列是有限制的，如果超過這個數字問題就無法讀取資料，

Linux信號的處理：如果這個行程正在用戶態忙著做別的事（例如在計算兩個矩陣的乘積），那就強行打斷之，呼叫事先注冊的信號處理函式，這個函式可以決定何時以及如何處理這個異步任務，由于信號處理函式是突然闖進來的，因此跟中斷處理程式一樣，有很多事情是不能做的，因此保險起見，一般是把事件 “登記” 一下放進佇列，然后回傳該行程原來在做的事，
如果這個行程正在內核態忙著做別的事，例如以同步阻塞方式讀寫磁盤，那就只好把這個通知掛起來了，等到內核態的事情忙完了，快要回到用戶態的時候，再觸發信號通知，
如果這個行程現在被掛起了，例如無事可做 sleep 了，那就把這個行程喚醒，下次有 CPU 空閑的時候，就會調度到這個行程，觸發信號通知，

異步 API 說來輕巧，做來難，這主要是對 API 的實作者而言的，Linux 的異步 IO（AIO）支持是 2.6.22 才引入的，還有很多系統呼叫不支持異步 IO，Linux 的異步 IO 最初是為資料庫設計的，因此通過異步 IO 的讀寫操作不會被快取或緩沖，這就無法利用作業系統的快取與緩沖機制，

很多人把 Linux 的 O_NONBLOCK 認為是異步方式，但事實上這是前面講的同步非阻塞方式，需要指出的是，雖然 Linux 上的 IO API 略顯粗糙，但每種編程框架都有封裝好的異步 IO 實作，作業系統少做事，把更多的自由留給用戶，正是 UNIX 的設計哲學，也是 Linux 上編程框架百花齊放的一個原因，

從前面 IO 模型的分類中，我們可以看出 AIO 的動機：

同步阻塞模型需要在 IO 操作開始時阻塞應用程式，這意味著不可能同時重疊進行處理和 IO 操作，
同步非阻塞模型允許處理和 IO 操作重疊進行，但是這需要應用程式根據重現的規則來檢查 IO 操作的狀態，
這樣就剩下異步非阻塞 IO 了，它允許處理和 IO 操作重疊進行，包括 IO 操作完成的通知，

異步IO

類比：老李去火車站買票，給售票員留下電話，有票后，售票員電話通知老李并快遞送票上門，耗費：往返車站1次，路上1小時，免黃牛費100元，無需打電話

當應用程式呼叫aio_read時，內核一方面去取資料報內容回傳，另一方面將程式控制權還給應用行程，應用行程繼續處理其他事情，是一種非阻塞的狀態，

當內核中有資料報就緒時，由內核將資料報拷貝到應用程式中，回傳aio_read中定義好的函式處理程式，

很少有Linux系統支持，Windows的IOCP就是該模型，可以看出，阻塞程度：阻塞IO>非阻塞IO>多路轉接IO>信號驅動IO>異步IO，效率是由低到高的，

歡迎關注御狐神的微信公眾號
file

參考檔案

IO和零拷貝
異步IO、epoll、零拷貝
IO概念和五種IO模型

本文最先發布至微信公眾號，著作權所有，禁止轉載！

轉載請註明出處，本文鏈接：https://www.uj5u.com/houduan/298232.html

標籤：Java

上一篇：面試官：談談 MySQL 聯合索引生效、失效的條件？

下一篇：spring boot 系列之八：SpringBoot處理定時任務

作業系統的IO模型