一、什么是IO
IO就是資料的輸入輸出,如果資料從外部設備輸入到記憶體中就是Input,反之從記憶體到外部設備就是Output;外部設備包括:檔案系統、網卡、螢屏.....

二、傳統的IO流程

- 用戶程式發起read()系統呼叫
- CPU 發出對應的指令給磁盤控制器,然后回傳;
- 磁盤控制器收到指令后,于是就開始準備資料,會把資料放入到磁盤控制器的內部緩沖區中,然后產生一個中斷信號;
- CPU 收到中斷信號后,停下手頭的作業,接著把磁盤控制器的緩沖區的資料一次一個位元組地讀進自己的暫存器,然后再把暫存器里的資料寫入到記憶體,
由此我們發現整個讀資料的程序,發生兩次系統呼叫,并且CPU整個處于阻塞狀態;實際上在磁盤控制器讀取資料到發送中斷信號的程序中,cpu是沒有任何需要參與的,顯然這種IO方式沒有很好的利用CPU資源,并且用戶態與內核太在進行多次切換,
三、直接記憶體訪問(Direct Memory Access)
DMA(Direct Memory Access)控制器是一種在系統內部轉移資料的獨特外設,可以將其視為一種能夠通過一組專用總線將內部和外部存盤器與每個具有DMA能力的外設連接起來的控制器

- 用戶行程呼叫 read 方法,向作業系統發出 I/O 請求,請求讀取資料到自己的記憶體緩沖區中,行程進入阻塞狀態;
- 作業系統收到請求后,進一步將 I/O 請求發送 DMA,然后讓 CPU 執行其他任務;
- DMA 進一步將 I/O 請求發送給磁盤;
- 磁盤收到 DMA 的 I/O 請求,把資料從磁盤讀取到磁盤控制器的緩沖區中,當磁盤控制器的緩沖區被讀滿后,向 DMA 發起中斷信號,告知自己緩沖區已滿;
- DMA 收到磁盤的信號,將磁盤控制器緩沖區中的資料拷貝到內核緩沖區中,此時不占用 CPU,CPU 可以執行其他任務;
- 當 DMA 讀取了足夠多的資料,就會發送中斷信號給 CPU;
- CPU 收到 DMA 的信號,知道資料已經準備好,于是將資料從內核拷貝到用戶空間,系統呼叫回傳;
由此我們發現CPU在整個程序中已經不在參與與磁盤的資料copy作業了,但是資料的copy作業依然發生了多次,并且用戶態與內核態的切換作業依然是兩次,如果要提高資料的傳輸速度,就需要從這兩方面入手,
四、零拷貝
讀取磁盤資料的時候,之所以要發生背景關系切換,這是因為用戶空間沒有權限操作磁盤或網卡,內核的權限最高,這些操作設備的程序都需要交由作業系統內核來完成,所以一般要通過內核去完成某些任務的時候,就需要使用作業系統提供的系統呼叫函式,而一次系統呼叫必然會發生 2 次背景關系切換:首先從用戶態切換到內核態,當內核執行完任務后,再切換回用戶態交由行程代碼執行,所以,要想減少背景關系切換到次數,就要減少系統呼叫的次數,
mmap() :該系統呼叫函式會直接把內核緩沖區里的資料映射到用戶空間,這樣,作業系統內核與用戶空間就不需要再進行任何的資料拷貝操作,
場景:讀取磁盤上的資料,然后發送至網路中(mmap + write)

- 應用行程呼叫了 mmap() 后,DMA 會把磁盤的資料拷貝到內核的緩沖區里,接著,應用行程跟作業系統內核共享這個緩沖區;
- 應用行程再呼叫 write(),作業系統直接將內核緩沖區的資料拷貝到 socket 緩沖區中,這一切都發生在內核態,由 CPU 來搬運資料;
- 最后,把內核的 socket 緩沖區里的資料,拷貝到網卡的緩沖區里,這個程序是由 DMA 搬運的,
由圖我們可以看出使用mmap( )函式相較于read( ),減少了一次資料copy的次數,因為他的內核緩沖區與用戶緩沖區是同一個共享緩沖區,但是在呼叫write( )發送資料時,仍然需要通過 CPU 把內核緩沖區的資料拷貝到 socket 緩沖區里,而且仍然需要 4 次背景關系切換,因為系統呼叫還是 2 次,
sendfile:在 Linux 內核版本 2.1 中,提供了一個專門發送檔案的系統呼叫函式 sendfile(),函式形式如下:
ssize_t sendfile(int out_fd, int in_fd, off_t *offset, size_t count);
它可以替代前面的 read() 和 write() 這兩個系統呼叫,這樣就可以減少一次系統呼叫,也就減少了 2 次背景關系切換的開銷,其次,該系統呼叫,可以直接把內核緩沖區里的資料拷貝到 socket 緩沖區里,不再拷貝到用戶態,這樣就只有 2 次背景關系切換,和 3 次資料拷貝,

網卡支持 SG-DMA(The Scatter-Gather Direct Memory Access)技術(和普通的 DMA 有所不同),我們可以進一步減少通過 CPU 把內核緩沖區里的資料拷貝到 socket 緩沖區的程序,真正的實作零拷貝(Zero-copy)技術,

- 通過 DMA 將磁盤上的資料拷貝到內核緩沖區里;
- 緩沖區描述符和資料長度傳到 socket 緩沖區,這樣網卡的 SG-DMA 控制器就可以直接將內核快取中的資料拷貝到網卡的緩沖區里,此程序不需要將資料從作業系統內核緩沖區拷貝到 socket 緩沖區中,這樣就減少了一次資料拷貝;
零拷貝技術的檔案傳輸方式相比傳統檔案傳輸的方式,減少了 2 次背景關系切換和資料拷貝次數,只需要 2 次背景關系切換和資料拷貝次數,就可以完成檔案的傳輸,而且 2 次的資料拷貝程序,都不需要通過 CPU,2 次都是由 DMA 來搬運,
五、PageCache
根據區域性原理,所以通常,剛被訪問的資料在短時間內再次被訪問的概率很高,于是我們可以用 PageCache 來快取最近被訪問的資料,當空間不足時淘汰最久未被訪問的快取,所以,讀磁盤資料的時候,優先在 PageCache 找,如果資料存在則可以直接回傳;如果沒有,則從磁盤中讀取,然后快取 PageCache 中,
感謝大佬的文章:https://zhuanlan.zhihu.com/p/258513662
轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/279161.html
標籤:其他
上一篇:作業系統之虛擬記憶體
