Unity渲染流程(渲染管線)(渲染流水線)
- 一 渲染的任務
- 二 三個概念階段
- 三 應用階段
- 1 準備好需要被渲染的場景資料,做粗粒度剔除
- 2 設定每個物件的渲染狀態,
- 3 發送DrawCall,
- 四 幾何階段
- 1 頂點著色器
- 2 裁剪
- 3 螢屏映射
- 五 光柵化階段
- 1 三角形設定
- 2 三角形遍歷
- 3 片元著色器
- 4 逐片元操作
計算機圖形庫的渲染命令由顯卡驅動(GPU Driver)翻譯成GPU(圖形處理器)能識別的語言,然后GPU讀取顯存中由渲染命令指定的資料(draw call則是把要求GPU根據頂點資料進行繪制, SetPass call時,會向顯存中傳遞大量的資源資訊,包括紋理資源也是在這時候加載到快取中)
一 渲染的任務
渲染流水線的作業任務在于==由一個三維場景出發、生成(或者說渲染)一張二維影像,==換句話說,計算機需要從一系列的頂點資料、紋理等資訊出發,把這些資訊最終轉換成一張人眼可以看到的影像,而這個作業通常是由CPU和 GPU共同完成的,
二 三個概念階段

三 應用階段
CPU負責實作,這一階段最重要的輸出是渲染所需的幾何資訊,即渲染圖元(rendering primitives),通俗來講,渲染圖元可以是點、線、三角面等,這些渲染圖元將會被傳遞給下一個階段——幾何階段,
1 準備好需要被渲染的場景資料,做粗粒度剔除
攝像機的位置,視錐體,場景中的模型,場景中的光源,粗粒度剔除也就是視錐體剔除在這個階段做,以包圍盒為單位
準備好資料后加載到顯存
所有渲染所需的資料都需要從硬碟(Hard Disk Drive,HDD)中加載到系統記憶體(RandomAccess Memory,RAM)中,然后,網格,位置資訊,法線方向,頂點顏色,紋理坐標等資料又被加載到顯卡上的存盤空間——顯存( VideoRandom Access Memory,VRAM)中,這是因為,顯卡對于顯存的訪問速度更快,而且大多數顯卡對于RAM沒有直接的訪問權利,圖2.3所示給出了這樣一個例子,

2 設定每個物件的渲染狀態,
渲染狀態包括所使用的著色器shader、紋理、材質(漫反射顏色,高光反射顏色)等,
什么是渲染狀態呢?一個通俗的解釋就是,這些狀態定義了場景中的網格是怎樣被渲染的,例如,使用哪個頂點著色器(Vertex Shader)/片元著色器(Fragment Shader)、光源屬性、材質等,如果我們沒有更改渲染狀態,那么所有的網格都將使用同一種渲染狀態,圖2.4顯示了當使用同一種渲染狀態時,渲染3個不同網格的結果,

3 發送DrawCall,
當給定一個DrawCall時,GPU會根據渲染狀態和輸入的頂點資料進行計算,

四 幾何階段

幾何階段用于處理所有和我們要繪制的幾何相關的事情,例如,決定需要繪制的圖元是什么,怎樣繪制它們,在哪里繪制它們,這一階段通常在 GPU上進行,
幾何階段負責和每個渲染圖元打交道,進行逐頂點、逐多邊形的操作,這個階段可以進一步分成更小的流水線階段,這在下一章中會講到,==幾何階段的一個重要任務就是把頂點坐標變換到螢屏空間中,再交給光柵器進行處理,==通過對輸入的渲染圖元進行多步處理后,這一階段將會輸出螢屏空間的二維頂點坐標、每個頂點對應的深度值、著色等相關資訊,并傳遞給下一個階段,
1 頂點著色器
頂點Vertex不是點,是點及點的資訊,幾何資訊和點位坐標,所以可以構成線段,多邊形,叫做圖元
頂點著色器(Vertex Shader)是流水線的第一個階段,它的輸入來自于CPU,頂點著色器的處理單位是頂點,也就是說,輸入進來的每個頂點都會呼叫一次頂點著色器,頂點著色器本身不可以創建或者銷毀任何頂點,而且無法得到頂點與頂點之間的關系,例如,我們無法得知兩個頂點是否屬于同一個三角網格,但正是因為這樣的相互獨立性,GPU可以利用本身的特性并行化處理每一個頂點,這意味著這一階段的處理速度會很快,
頂點著色器需要完成的作業主要有:坐標變換和逐頂點光照(如果需要,也就是計算輸出頂點的顏色),當然,除了這兩個主要任務外,頂點著色器還可以輸出后續階段所需的資料,圖2.7展示了在頂點著色器中對頂點位置進行坐標變換并計算頂點顏色的程序,
齊次裁剪空間不是螢屏空間,是xyz都為1的空間

2 裁剪
由于我們的場景可能會很大,而攝像機的視野范圍很有可能不會覆寫所有的場景物體,一個很自然的想法就是,那些不在攝像機視野范圍的物體不需要被處理,而裁剪(Clipping)就是為了完成這個目的而被提出來的,
一個圖元和攝像機視野的關系有3種:完全在視野內、部分在視野內、完全在視野外,完全在視野內的圖元就繼續傳遞給下一個流水線階段,完全在視野外的圖元不會繼續向下傳遞,因為它們不需要被渲染,而那些部分在視野內的圖元需要進行一個處理,這就是裁剪,例如,一條線段的一個頂點在視野內,而另一個頂點不在視野內,那么在視野外部的頂點應該使用一個新的頂點來代替,這個新的頂點位于這條線段和視野邊界的交點處,
由于我們已知在NDC下的頂點位置,即頂點位置在一個立方體內,因此裁剪就變得很簡單:只需要將圖元裁剪到單位立方體內,圖2.9展示了這樣的一個程序,
![[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-ZFOyKy2H-1620137815507)(D:\強哥的檔案\Typroa素材\image-20210226085232879.png)]](https://img.uj5u.com/2021/05/07/241961071513289.png)
3 螢屏映射
這一步輸入的坐標仍然是三維坐標系下的坐標(范圍在單位立方體內),螢屏映射(Screen Mapping)的任務是把每個圖元的x和y坐標轉換到螢屏坐標系(Screen Coordinates)下,螢屏坐標系是一個二維坐標系,它和我們用于顯示畫面的解析度有很大關系,
假設,我們需要把場景渲染到一個視窗上,視窗的范圍是從最小的視窗坐標(xy,)到最大的視窗坐標(x.yz),其中x<且y<y,由于我們輸入的坐標范圍在-1到1,因此可以想象到,這個程序實際是一個縮放的程序,如圖2.10所示,你可能會問,那么輸入的z坐標會怎么樣呢?螢屏映射不會對輸入的z坐標做任何處理,實際上,螢屏坐標系和z坐標一起構成了一個坐標系,叫做視窗坐標系(Window Coordinates),這些值會一起被傳遞到光柵化階段,

五 光柵化階段
這一階段將會使用上個階段傳遞的資料(螢屏坐標系下的頂點位置以及和它們相關的額外資訊,如深度值(z坐標)、法線方向、視角方向等,)來產生螢屏上的像素,并渲染出最終的影像,這一階段也是在GPU上運行,光柵化的任務主要是決定每個渲染圖元中的哪些像素應該被繪制在螢屏上,然后計算顏色它需要對上一個階段得到的逐頂點資料(例如紋理坐標、頂點顏色等)進行插值,然后再進行逐像素處理,
1 三角形設定
光柵化的第一個流水線階段是三角形設定(Triangle Setup),這個階段會計算光柵化一個三角網格所需的資訊,具體來說,上一個階段輸出的都是三角網格的頂點,即我們得到的是三角網格每條邊的兩個端點,但如果要得到整個三角網格對像素的覆寫情況,我們就必須計算每條邊上的像素坐標,為了能夠計算邊界像素的坐標資訊,我們就需要得到三角形邊界的表示方式,這樣一個計算三角網格表示資料的程序就叫做三角形設定,它的輸出是為了給下一個階段做準備,
2 三角形遍歷

這一步的輸出就是得到一個片元序列,需要注意的是,一個片元并不是真正意義上的像素,而是包含了很多狀態的集合,這些狀態用于計算每個像素的最終顏色,這些狀態包括了(但不限于)它的螢屏坐標、深度資訊,以及其他從幾何階段輸出的頂點資訊,例如法線、紋理坐標等,
3 片元著色器
片元著色器的輸入是上一個階段對頂點資訊插值得到的結果,更具體來說,是根據那些從頂點著色器中輸出的資料插值得到的,而它的輸出是一個或者多個顏色值,圖2.13顯示了這樣一個程序,
這一階段可以完成很多重要的渲染技術,其中==最重要的技術之一就是紋理采樣,==為了在片元著色器中進行紋理采樣,我們通常會在頂點著色器階段輸出每個頂點對應的紋理坐標,然后經過光柵化階段對三角網格的3個頂點對應的紋理坐標進行插值后,就可以得到其覆寫的片元的紋理坐標了

4 逐片元操作
終于到了渲染流水線的最后一步,逐片元操作(Per-Fragment Operations)是OpenGL 中的說法,在 DirectX中,這一階段被稱為輸出合并階段(Output-Merger),Merger這個詞可能更容易讓讀者明白這一步驟的目的:合并,而OpenGL中的名字可以讓讀者明白這個階段的操作單位,即是對每一個片元進行一些操作,那么問題來了,要合并哪些資料?又要進行哪些操作呢?
這一階段有幾個主要任務,
(1))決定每個片元的可見性,這涉及了很多測驗作業,例如深度測驗、模板測驗等,
(2)如果一個片元通過了所有的測驗,就需要把這個片元的顏色值和已經存盤在顏色緩沖區中的顏色進行合并,或者說是混合,
需要指明的是,逐片元操作階段是高度可配置性的,即我們可以設定每一步的操作細節,這在后面會講到,
這個階段首先需要解決每個片元的可見性問題,這需要進行一系列測驗,這就好比考試,一個片元只有通過了所有的考試,才能最侄訓得和GPU談判的資格,這個資格指的是它可以和顏色緩沖區進行合并,如果它沒有通過其中的某一個測驗,那么對不起,之前為了產生這個片元所做的所有作業都是白費的,因為這個片元會被舍棄掉,Poor fragment!圖2.14給出了簡化后的逐片元操作所做的操作,

在模板緩沖中,(通常)每個模板值(Stencil Value)是8位的,所以每個像素/片段一共能有256種不同的模板值,我們可以將這些模板值設定為我們想要的值,然后當某一個片段有某一個模板值的時候,我們就可以選擇丟棄或是保留這個片段了,
我們先來看模板測驗(Stencil Test),與之相關的是模板緩沖(Stencil Buffer),實際上,模板緩沖和我們經常聽到的顏色緩沖、深度緩沖幾乎是一類東西,如果開啟了模板測驗,GPU 會首先讀取(使用讀取掩碼)模板緩沖區中該片元位置的模板值,然后將該值和讀取(使用讀取掩碼)到的參考值(reference value)進行比較,這個比較函式可以是由開發者指定的,例如小于時舍棄該片元,或者大于等于時舍棄該片元,如果這個片元沒有通過這個測驗,該片元就會被舍棄,不管一個片元有沒有通過模板測驗,我們都可以根據模板測驗和下面的深度測驗結果來修改模板緩沖區,這個修改操作也是由開發者指定的,開發者可以設定不同結果下的修改操作,例如,在失
敗時模板緩沖區保持不變,通過時將模板緩沖區中對應位置的值加1等,模板測驗通常用于限制渲染的區域,另外,模板測驗還有一些更高級的用法,如渲染陰影、輪廓渲染等,

如果一個片元幸運地通過了模板測驗,那么它會進行下一個測驗——深度測驗(Depth Test),相信很多讀者都聽到過這個測驗,這個測驗同樣是可以高度配置的,如果開啟了深度測驗,GPU會把該片元的深度值和已經存在于深度緩沖區中的深度值進行比較,這個比較函式也是可由開發者設定的,例如小于時舍棄該片元,或者大于等于時舍棄該片元,通常這個比較函式是小于等于的關系,即如果這個片元的深度值大于等于當前深度緩沖區中的值,那么就會舍棄它,這是因為,我們總想只顯示出離攝像機最近的物體,而那些被其他物體遮擋的就不需要出現在螢屏上,如果這個片元沒有通過這個測驗,該片元就會被舍棄,和模板測驗有些不同的是,如果一個片元沒有通過深度測驗,它就沒有權利更改深度緩沖區中的值,而如果它通過了測驗,開發者還可以指定是否要用這個片元的深度值覆寫掉原有的深度值,這是通過開啟/關閉深度寫入來做到的,我們在后面的學習中會發現,透明效果和深度測驗以及深度寫入的關系非常密切,

如果一個幸運的片元通過了上面的所有測驗,它就可以自豪地來到合并功能的面前,
為什么需要合并?我們要知道,這里所討論的渲染程序是一個物體接著一個物體畫到螢屏上的,而每個像素的顏色資訊被存盤在一個名為顏色緩沖的地方,因此,當我們執行這次渲染時,顏色緩沖中往往已經有了上次渲染之后的顏色結果,那么,我們是使用這次渲染得到的顏色完全覆寫掉之前的結果,還是進行其他處理?這就是合并需要解決的問題,
對于==不透明物體,開發者可以關倍訓合(Blend)操作,這樣片元著色器計算得到的顏色值就會直接覆寫掉顏色緩沖區中的像素值,但對于半透明物體,我們就需要使用混合操作來讓這個物體看起來是透明的,==圖2.16展示了一個簡化版的混合操作的流程圖,

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/283227.html
標籤:其他
