背景
Read the fucking source code!--By 魯迅A picture is worth a thousand words.--By 高爾基
說明:
- KVM版本:5.9.1
- QEMU版本:5.0.0
- 工具:Source Insight 3.5, Visio
- 文章同步在博客園:
https://www.cnblogs.com/LoyenWang/
新的一年, 大家牛起來!
祝小姐姐們:
落雁沉魚 蘭質蕙心 明眸皓齒 螓首蛾眉 天生麗質 天香國色 杏臉桃腮 煦色韶光 涎玉沫珠 宜嗔宜喜 遠山芙蓉 艷色絕世 余霞成綺 阿嬌金屋 逞嬌呈美 國色天香 花顏月貌 絕色佳人 暗香盈袖 閉月羞花 傾國傾城 溫婉嫻淑 千嬌百媚 儀態萬千...
祝男的:
新年好,
1. 概述
先來張圖:

- 圖中羅列了四個關鍵模塊:
Virtio Device、Virtio Driver、Virtqueue、Notification(eventfd/irqfd); Virtio Driver:前端部分,處理用戶請求,并將I/O請求轉移到后端;Virtio Device:后端部分,由Qemu來實作,接收前端的I/O請求,并通過物理設備進行I/O操作;Virtqueue:中間層部分,用于資料的傳輸;Notification:互動方式,用于異步事件的通知;
想在一篇文章中寫完這四個模塊,有點too yong too simple,所以,看起來又是一個系列文章了,
本文先從Qemu側的virtio device入手,我會選擇從一個實際的設備來闡述,沒錯,還是上篇文章中提到的網路設備,
2. 流程分析
在Qemu的網卡虛擬化時,通常會創建一個虛擬網卡前端和虛擬網卡后端,如下圖:

- 在虛擬機創建的時候指定引數:
-netdev tap, id = tap0, -device virtio-net-pci, netdev=tap0; - 創建一個
Tap網卡后端設備; - 創建一個
Virtio-Net網卡前端設備; - 網卡前端設備和后端設備進行互動,最終與Host的驅動完成資料的收發;
全文圍繞著Tap設備的創建和Virtio-Net設備的創建展開,
入口流程如下:

- Qemu的代碼閱讀起來還是比較費勁的,各種盤根錯節,里邊充斥著面向物件的思想,先給自己挖個坑,后續會專題研究的,
this is for you, you have my words.; - 圖中與本文相關的有三個模塊:1)模塊初始化;2)網路設備初始化;3)設備初始化;
- Qemu中設備模擬通過
type_init先編譯進系統,在module_call_init時進行回呼,比如圖中的xxx_register_types,在這些函式中都是根據TypeInfo型別資訊來創建具體的實作資訊; net_init_client用來創建網路設備,比如Tap設備;device_init_func根據Qemu命令的傳入引數創建虛擬設備,比如Virtio-Net;
- Qemu中設備模擬通過
下邊進入細節,the devil is in the details,
3. tap創建
從上文中,我們知道,Tap與Virtio-Net屬于前后端的關系,最終是通過結構體分別指向對方,如下圖:

NetClientState是網卡模擬的核心結構,表示網路設備中的幾個端點,兩個端點通過peer指向對方;
創建Tap設備的主要作業就是創建一個NetClientState結構,并添加到net_clients鏈表中:

函式的呼叫細節如下圖:

- 處理流程只關注了核心的處理流程,整個程序有很多關于傳入引數的處理,選擇性忽略了;
net_tap_init:與Host的tun驅動進行互動,其實質就是打開該設備檔案,并進行相應的配置等;net_tap_fd_init:根據net_tap_info結構,創建NetClientState,并進行相關設定,這里邊net_tap_info結構體中的接收函式指標用于實際的資料傳輸處理;tap_read_poll用于將fd添加到Qemu的AioContext中,用于異步回應,當有資料來臨時,捕獲事件并進行處理;
以上就是Tap后端的創建程序,下文將針對前端創建了,
4. virtio-net創建
這是一個復雜的流程,
4.1 資料結構
Qemu中用C語言實作了面向物件的模型,用于對設備進行抽象,精妙!
針對Virtio-Net設備,結構體及拓撲組織關系如下圖:

DeviceState作為所有設備的父類,其中派生了VirtIODevice和PCIDevice,而本文研究的Virtio-Net派生自VirtIODevice;- Qemu中會虛擬一個PCI總線,同時創建
virtio-net-pci,virtio-balloon-pci,virtio-scsi-pci等PCI代理設備,這些代理設備掛載在PCI總線上,同時會創建Virtio總線,用于掛載最終的設備,比如VirtIONet; - PCI代理設備就是一個紐帶;
4.2 流程分析
與設備創建相關的三個函式,可以從device_init_func入口跟蹤得知:

- 當Qemu命令通過
-device傳入引數時,device_init_func會根據引數去查找設備,并最終呼叫到該設備對應的類初始化函式、物件初始化函式、以及realize函式; - 所以,我們的分析就是這三個入口;
4.2.1 class_init

- 在網卡虛擬化程序中,引數只需要指定PCI代理設備即可,也就是
-device virtio-net-pci, netdev=tap0,從而會呼叫到virtio_net_pci_class_init函式; - 由于實作了類的繼承關系,在子類初始化之前,需要先呼叫父類的實作,圖中也表明了繼承關系以及呼叫函式順序;
- C語言實作繼承,也就是將父物件放置在自己結構體的開始位置,圖中的顏色能看出來;
4.2.2 instance_init
類初始化結束后,開始物件的創建:

- 針對
Virtio-Net-PCI的實體化比較簡單,作為代理,負責將它的后繼物件初始化,也就是本文的前端設備Virtio-Net;
4.2.3 realize

realize的呼叫,比較繞,簡單來說,它的類繼承關系中存在多個realize的函式指標,最侄訓從父類開始執行,一直呼叫到子類,而這些函式指標的初始化在什么時候做的呢?沒錯,就是在class_init類初始化的時候,進行了賦值,細節不表,結論可靠;- 最終的呼叫關系就如圖了;
到目前為止,我們似乎都還沒有看到Virtio-Net設備的相關操作,不用著急,已經很接近真相了:

virtio_net_pci_realize函式,會觸發virtio_device_realize的呼叫,該函式是一個通用的virtio設備實作函式,所有的virtio設備都會呼叫,而我們的前端設備Virtio-Net也是virtio設備;virtio_net_device_realize就到了我們的主角了,它進行了virtio通用的設定(后續在資料通信中再分析),還創建了一個NetClientState端點,與Tap設備對應,分別指向了對方,惺惺相惜,各自安好;virtio_bus_device_plugged表示設備插入總線時的處理,完成的作業就是按照PCI總線規劃,配置各類資訊,以便與Guest OS中的virtio驅動互動,后續的文章再分析了;
本文基本捋清了虛擬網卡前端設備和后端設備的創建程序,完成的作業只是系結了彼此,資料互動以及通知機制,留給后續吧,
參考
《 Virtual I/O Device (VIRTIO) Version 1.1》
https://www.redhat.com/en/blog/virtio-devices-and-drivers-overview-headjack-and-phone
歡迎關注個人公眾號,不定期更新技術文章,

轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/259093.html
標籤:其他
下一篇:Dell電腦重裝系統故障
