一、Slice 和 Slice Segment

??H265和H264類似，圖片也采用了slice的分割方法，一幀圖片可以被分割成一個或者多個slice，每一個slice都可以獨立解碼，不依賴于同張圖片的其他slice，那也就意味著在進行幀內和幀間預測時不能越過slice的邊界，但是在解碼最后環路濾波時，允許濾波器跨越slice邊界進行濾波，

??采用slice分割主要有以下好處：
??第一，魯棒性良好，把一張圖片分成一個個獨立的slice，在解碼時遇到錯誤，也可以實作再同步，減少錯誤蔓延，而代價僅僅是失去了一個slice，
??第二，匹配MTU（Maximum Transmission Unit）大小，這涉及到網路層的概念，網路上發包時，每個包的大小受到限制，把影像分割成slice可以減小打包的大小，
??第三，并行處理，由于每個slice相互獨立的緣故，編碼、解碼以至環路濾波均可以并行處理，加快處理速度，提高效率，

??如下圖，為一張圖片分割后的結果，這張圖片被分割成兩個slice，圖中黑色實線（即Slice Boundary）為slice邊界，可以看到實線下方為一塊完整的區域，而實線上方又被分成了3塊小區域，以虛線分隔，這每一塊小區域稱為片段SS（Slice Segment），即slice又可以分為SS，每個slice的第一塊SS稱為獨立SS（圖中藍色部分），后面的均為依賴SS（圖中未涂色部分）；獨立SS是指它所涉及的句法元素可以由自身確定，依賴SS是指它所涉及的某些句法元素由已解碼的獨立SS推導得到，依賴SS可以共享獨立SS攜帶的一些資訊，預測的程序不可以跨越獨立SS的邊界，但是可以跨越依賴SS的邊界，一個slice中的SS可以互相參考，

??下面的圖中，還可以看到標有數字的小方格，每個SS由這一個個小方格組成，這每一個小方格稱為一個樹形編碼單元CTU（Coding Tree Unit），這類似于H264中的宏塊，有些文章里把這些小方格叫做樹形編碼塊CTB（Coding Tree Block），其實差不多，實際上，一個CTU是由一個亮度（luma）CTB和相應色度（chroma）CTB構成，

二、Tile單元

??H265與H264不同之處在于引入了Tile的概念，PPS（Picture Parameter Set）中tiles_enabled_flag引數指定了是否使用Tile格式，num_tile_columns_minus1、num_tile_rows_ minus1、uniform_spacing_flag、column_width_minus1、row_ height_minus1規定了Tile的結構大小（這些引數以后再說），Tile和slice一樣也是可以單獨解碼，不依賴其他Tile，

??如下圖，一張圖片被分為了九個區域，但是這些區域必須是矩形，而slice是條帶狀，可以看到，Tile是由CTU直接組成，相比于slice的分割方法，Tile的分割方法使得編碼效率更高，因為條帶狀的分割方式使得像素之間的關聯程度大大下降，編解碼的效率大打折扣，同時，slice的傳輸需要加上一個slice header，當碼率較大時，header的開銷無法被忽略，而Tile不需要header，進一步提高了編碼效率，

??細心一點可以注意到，slice中的CTU是以光柵掃描（raster scan）的形式排布的，即從左到右、從上到下；而Tile在劃分為矩形塊后，不僅每個小塊內以光柵掃描方式排布，而且每個矩形塊也是按光柵掃描方式排布，這種掃描方式可以減少運動估計（Motion Estimation）時所需行buffer大小，如下圖所示，虛線矩形框代表的時運動估計的范圍，涂黑的方格為一行參與編碼的CTU，若用公式表達一般raster scan和Tile的掃描方式所占用的運動估計buffer：

RSBuffer = PicW * （2 * SRy + CtuHeight）
TileBuffer = （TileW + 2 * SRx） * （2 * SRy + CtuHeight）

??PicW是影像的寬度，SRy是CTU上下延伸的范圍（圖中綠色雙向箭頭），SRx是CTU左右延伸的范圍（圖中黑色雙向箭頭），CtuHeight為每個CTU的高度，能看到，當PicW大于（TileW + 2 * SRx)時，Tile在做運動估計時將占用更小的記憶體，

??如下圖所示，圖片中使用了Tile和slice結合的分割方法，左圖和右圖均被分為了兩個Tile，中間豎直虛線為分界線，左圖中只劃分了一個slice，一個獨立SS和四個依賴SS（藍色部分為獨立SS，未涂色部分為依賴SS）；而右圖劃分了3個slice，每個slice包含一個獨立SS和一個依賴SS，這兩種劃分方式并不是隨意劃分，而是需要遵循一定規則：
??第一，一個slice/SS中的所有CTU屬于同一個Tile；
??第二，一個Tile中的所有CTU屬于同一個slice/SS，

三、CTU、CU

??之前傳統的編碼（例如H264）均是基于宏塊實作的，對于4:2:0的采樣格式，每個宏塊包含一個16x16大小的色度塊，以及一個8x8大小的亮度塊，而H265提出了CTU的概念，它的尺寸可以由編碼器指定，在影像細節較多的地方可以采用較小的編碼塊，在平坦的地方可以選擇較大的編碼塊，除了CTU，H265還提出了CU（Coding Unit）、PU（Prediction Unit）、TU（Transform Unit），這些后面再說，

??上面說了一個CTU由一個亮度CTB和相應色度CTB構成，因為采樣的格式不同，亮度CTB相同的情況下，色度CTB的大小會不一樣，所以我們只需要關注亮度CTB大小即可，一個CTU所含亮度CTB的大小為NxN，N取值為16、32、64，下圖a即是16x16大小的CTU，b圖是64x64大小的CTU，可以看到，a圖CTU所包含的區域很小，而b圖CTU包含的區域又很大，所以在H265中，大的區域可以以四叉樹的形式繼續往下分割，

??CTU再往下一級叫做CU，和它的老大CTU一樣，CU也是由一個亮度CB（Coding Block）和相應色度CB構成，同樣道理，CTU可以繼續分割，CTB也可以繼續往下分割為更小的CB，上面講到亮度CTB最小為16x16，而分割成的CB最小為8x8，先看一張直觀的圖，很直觀，直觀到應該不用我過多贅述，

??再看一張抽象一點的，四叉樹模型，這圖應該也不難懂，下左圖中的數字就代表了CTU編碼的順序，至于PU、TU后面再補上，文章有錯誤的請指正，共同學習，

參考

[1] [新一代高效視頻編碼H.265/HEVC原理、標準與實作]
[2] [High Efficiency Video Coding(Hevc) Algorithms and Architectures]
[3] [An Overview of Tiles in HEVC, Kiran Misra, Member, IEEE]

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/271906.html

標籤：其他

上一篇：百度PaddleOCR字符識別推理部署（C++）

下一篇：【資料壓縮作業】bmp圖片序列生成yuv視頻