1、Stream 與 Channel
- stream 不會自動緩沖資料,channel 會利用系統提供的發送緩沖區、接識訓沖區(更為底層)
- stream 僅支持阻塞 API,channel 同時支持阻塞、非阻塞 API,網路 channel 可配合 selector 實作多路復用
- 二者均為全雙工,即讀寫可以同時進行
- 雖然 Stream 是單向流動的,但是它也是全雙工的
2、IO 模型
- 同步:執行緒自己去獲取結果(一個執行緒)
- 例如:執行緒呼叫一個方法后,需要等待方法回傳結果
- 異步:執行緒自己不去獲取結果,而是由其它執行緒回傳結果(至少兩個執行緒)
- 例如:執行緒 A 呼叫一個方法后,繼續向下運行,運行結果由執行緒 B 回傳
當呼叫一次 channel.read 或 stream.read 后,會由用戶態切換至作業系統內核態來完成真正資料讀取,而讀取又分為兩個階段,分別為:
- 等待資料階段
- 復制資料階段

根據 UNIX 網路編程 - 卷 I,IO 模型主要有以下幾種
阻塞 IO

- 用戶執行緒進行 read 操作時,需要等待作業系統執行實際的 read 操作,此期間用戶執行緒是被阻塞的,無法執行其他操作
非阻塞IO

-
用戶執行緒
在一個回圈中一直呼叫 read 方法,若內核空間中還沒有資料可讀,立即回傳
- 只是在等待階段非阻塞
-
用戶執行緒發現內核空間中有資料后,等待內核空間執行復制資料,待復制結束后回傳結果
多路復用

Java 中通過 Selector 實作多路復用
- 當沒有事件是,呼叫 select 方法會被阻塞住
- 一旦有一個或多個事件發生后,就會處理對應的事件,從而實作多路復用
多路復用與阻塞IO的區別
- 阻塞 IO 模式下,若執行緒因 accept 事件被阻塞,發生 read 事件后,仍需等待 accept 事件執行完成后,才能去處理 read 事件
- 多路復用模式下,一個事件發生后,若另一個事件處于阻塞狀態,不會影響該事件的執行
異步IO

- 執行緒 1 呼叫方法后理解回傳,不會被阻塞也不需要立即獲取結果
- 當方法的運行結果出來以后,由執行緒 2 將結果回傳給執行緒 1
3、零拷貝
零拷貝指的是資料無需拷貝到 JVM 記憶體中,同時具有以下三個優點
- 更少的用戶態與內核態的切換
- 不利用 cpu 計算,減少 cpu 快取偽共享
- 零拷貝適合小檔案傳輸
傳統 IO 問題
傳統的 IO 將一個檔案通過 socket 寫出
File f = new File("helloword/data.txt");
RandomAccessFile file = new RandomAccessFile(file, "r");
byte[] buf = new byte[(int)f.length()];
file.read(buf);
Socket socket = ...;
socket.getOutputStream().write(buf);
內部作業流如下

-
Java 本身并不具備 IO 讀寫能力,因此 read 方法呼叫后,要從 Java 程式的用戶態切換至內核態,去呼叫作業系統(Kernel)的讀能力,將資料讀入內核緩沖區,這期間用戶執行緒阻塞,作業系統使用 DMA(Direct Memory Access)來實作檔案讀,其間也不會使用 CPU
DMA 也可以理解為硬體單元,用來解放 cpu 完成檔案 IO
-
從內核態切換回用戶態,將資料從內核緩沖區讀入用戶緩沖區(即 byte [] buf),這期間 CPU 會參與拷貝,無法利用 DMA
-
呼叫 write 方法,這時將資料從用戶緩沖區(byte [] buf)寫入 socket 緩沖區,CPU 會參與拷貝
-
接下來要向網卡寫資料,這項能力 Java 又不具備,因此又得從用戶態切換至內核態,呼叫作業系統的寫能力,使用 DMA 將 socket 緩沖區的資料寫入網卡,不會使用 CPU
可以看到中間環節較多,java 的 IO 實際不是物理設備級別的讀寫,而是快取的復制,底層的真正讀寫是作業系統來完成的
- 用戶態與內核態的切換發生了 3 次,這個操作比較重量級
- 資料拷貝了共 4 次
NIO優化
通過 DirectByteBuf
- ByteBuffer.allocate(10)
- 底層對應 HeapByteBuffer,使用的還是 Java 記憶體
- ByteBuffer.allocateDirect(10)
- 底層對應 DirectByteBuffer,使用的是作業系統記憶體

大部分步驟與優化前相同,唯有一點:Java 可以使用 DirectByteBuffer 將堆外記憶體映射到 JVM 記憶體中來直接訪問使用
- 這塊記憶體不受 JVM 垃圾回收的影響,因此記憶體地址固定,有助于 IO 讀寫
- Java 中的 DirectByteBuf 物件僅維護了此記憶體的虛參考,記憶體回收分成兩步
- DirectByteBuffer 物件被垃圾回收,將虛參考加入參考佇列
- 當參考的物件 ByteBuffer 被垃圾回收以后,虛參考物件 Cleaner 就會被放入參考佇列中,然后呼叫 Cleaner 的 clean 方法來釋放直接記憶體
- DirectByteBuffer 的釋放底層呼叫的是 Unsafe 的 freeMemory 方法
- 通過專門執行緒訪問參考佇列,根據虛參考釋放堆外記憶體
- DirectByteBuffer 物件被垃圾回收,將虛參考加入參考佇列
- 減少了一次資料拷貝,用戶態與內核態的切換次數沒有減少
進一步優化 1
以下兩種方式都是零拷貝,即無需將資料拷貝到用戶緩沖區中(JVM 記憶體中)
底層采用了 linux 2.1 后提供的 sendFile 方法,Java 中對應著兩個 channel 呼叫 transferTo/transferFrom 方法拷貝資料

- Java 呼叫 transferTo 方法后,要從 Java 程式的用戶態切換至內核態,使用 DMA 將資料讀入內核緩沖區,不會使用 CPU
- 資料從內核緩沖區傳輸到 socket 緩沖區,CPU 會參與拷貝
- 最后使用 DMA 將 socket 緩沖區的資料寫入網卡,不會使用 CPU
這種方法下
- 只發生了 1 次用戶態與內核態的切換
- 資料拷貝了 3 次
進一步優化 2
linux 2.4 對上述方法再次進行了優化

- Java 呼叫 transferTo 方法后,要從 Java 程式的用戶態切換至內核態,使用 DMA 將資料讀入內核緩沖區,不會使用 CPU
- 只會將一些 offset 和 length 資訊拷入 socket 緩沖區,幾乎無消耗
- 使用 DMA 將 內核緩沖區的資料寫入網卡,不會使用 CPU
整個程序僅只發生了 1 次用戶態與內核態的切換,資料拷貝了 2 次
4、AIO
AIO 用來解決資料復制階段的阻塞問題
- 同步意味著,在進行讀寫操作時,執行緒需要等待結果,還是相當于閑置
- 異步意味著,在進行讀寫操作時,執行緒不必等待結果,而是將來由作業系統來通過回呼方式由另外的執行緒來獲得結果
異步模型需要底層作業系統(Kernel)提供支持
- Windows 系統通過 IOCP 實作了真正的異步 IO
- Linux 系統異步 IO 在 2.6 版本引入,但其底層實作還是用多路復用模擬了異步 IO,性能沒有優勢
本文由
傳智教育博學谷教研團隊發布,如果本文對您有幫助,歡迎
關注和點贊;如果您有任何建議也可留言評論或私信,您的支持是我堅持創作的動力,轉載請注明出處!
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/541176.html
標籤:其他
