閱讀文獻《DCRNet：Dilated Convolution based CSI Feedback Compression for Massive MIMO Systems》-有解無憂

這篇文章的作者是廣州大學的范立生老師和他的學生湯舜璞，于2022年10月發表在 IEEE TRANSACTIONS ON VEHICULAR TECHNOLOGY，

文獻提出了一種基于空洞卷積（Dilated Convolution）的CSI反饋網路，即空洞信道重建網路(Dilated Channel Reconstruction Network, DCRNet)，還設計了編碼器和解碼器塊，提高了重建性能并降低計算復雜度，

1 研究背景

在下行MIMO系統中，利用信道狀態資訊(CSI)是BS完成預編碼設計的前提，在時分雙工(TDD)模式下，由于信道的互易性，BS可以直接獲得下行鏈路的CSI，然而在頻分雙工(FDD)模式下，因為BS由于榷訓易而難以獲得CSI資訊，下行鏈路的CSI必須由UE來估計，但在大規模MIMO系統中，反饋CSI矩陣的開銷隨著天線數量的增加而增加，也受到用戶的發射功率和上行帶寬的限制，因此，需要對反饋CSI進行壓縮，

傳統基于CS的方法如LASSO和BM3D-AMP演算法等存在一些局限性，如假設CSI是理想稀疏的，在隨機工程中忽略了信道統計，迭代處理導致了較大的延遲等，

基于深度學習的方法如CsiNet等，優于傳統的基于CS的演算法，而且可以有效地減小網路引數，這類演算法的主要限制是網路架構不能提供足夠的感受野(receptive field, RecF)*，表明深層神經元不能表示原始輸入的足夠區域，為了克服這種限制，一些論文提出了設計更大的RecF以增加卷積大小來提高CSI重建性能，代價是增加網路的復雜度，因此，設計一種輕量級的網路架構，在較低計算復雜度下提高RecF的同時，又能保持CSI重構的性能，是非常重要的，

文章的主要貢獻有：

提出了一種基于擴展卷積的CSI反饋網路DCRNet，該網路在有效壓縮CSI反饋的同時降低了計算復雜度；
在不增加卷積大小的情況下，利用擴展卷積增強RecF網路，重新設計了一種先進的編碼器和解碼器塊，以提高重構性能，降低計算復雜度，

*感受野：CNN中每一層輸出的特征圖上的像素點映射回輸入影像上的區域大小，通俗點的解釋是，特征圖上一點，相對于原圖的大小，也是卷積神經網路特征所能看到輸入影像的區域，

2 CSI反饋系統

考慮頻分雙工MIMO下行鏈路，在BS上有$Nt>>1$根天線，在每個UE上有1根天線，在OFDM中有${N}_{\mathrm{c}}$個子載波，第n個子載波的復值接收信號為：

\[y_n={\mathbf{h}}_n^H \mathbf{b}_n x_n+z_n, \]

${\mathbf{h}}_n \in \mathbb{C}^{N_{\mathrm{t}} \times 1}, (·)^H,\mathbf{b}_n \in \mathbb{C}^{N_{\mathrm{t}} \times 1}, x_n \in \mathbb{C} \text {, 和 } z_n \in \mathbb{C}$分別表示第$n$個子載波上的信道增益向量、共軛轉置、波束成形向量、發射信號和加性高斯白噪聲(AWGN)，所有子載波的CSI可表示為矩陣${\mathbf{H}}=\left[{\mathbf{h}}_1, {\mathbf{h}}_2, \ldots, {\mathbf{h}}_{{N}_c}\right] \in \mathbb{C}^{N_t \times {N}_c}$，其中共有$2N_cN_t$個元素，

BS的波束形成和預編碼設計需要CSI矩陣H的反饋，但MIMO的天線數量導致巨大的開銷，為了解決這個問題，需要將CSI矩陣H壓縮后再反饋給BS，CSI反饋模型如圖1所示，

圖1 CSI反饋結構

CSI矩陣H首先通過離散傅里葉變換(DFT)從空間域和頻域變換到角域和延遲域，即：

\[\tilde{H}=F_cHF_t^H, \]

其中，$F_c,F_t$分別為$Nc × Nc$和$Nt × Nt $的DFT變換矩陣，由于多徑到達有延遲區間，矩陣$\tilde{H}$在角延遲域中是稀疏的，它可以分為兩部分，一部分是$H_a$，其中有$N_a$行由非零元素組成($N_a < N_c$)，另一部分其余$N_c?N_a$行由近零元素組成，把信道矩陣$H$壓縮為$H_a$，而且資訊損失可以忽略不計，

為了進一步壓縮CSI矩陣，還要應用基于深度學習的自編碼壓縮和恢復模塊，如圖1所示，通過編碼器壓縮CSI矩陣輸出較小的碼字向量：

\[\begin{align*} \boldsymbol{v}=\mathcal {E}(\theta _{1},\boldsymbol{H}_{\boldsymbol{a}}), \tag{3} \end{align*} \]

其中，$\mathcal {E}(·)$代表壓縮操作，$\theta_1$代表編碼器的引數，壓縮后的CSI矩陣通過專用的信道反饋給BS，然后BS通過解碼器恢復CSI矩陣：

\[\begin{align*} \hat{\boldsymbol{H}}_{\boldsymbol{a}}=\mathcal {D}(\theta _{2},\boldsymbol{v}), \tag{4} \end{align*} \]

其中，$\mathcal {D}(·)$代表壓縮操作，$\theta_2$代表解碼器的引數，CSI反饋的目的是為了最小化平均重構誤差：

\[\begin{align*} \min _{(\theta _{1},\theta _{2})} \mathbb {E}||\boldsymbol{H}_{\boldsymbol{a}}-\hat{\boldsymbol{H}}_{\boldsymbol{a}}||_{2}, \tag{5} \end{align*} \]

3 基于空洞卷積的CSI反饋

3.1 DCRNet的結構

基于卷積神經網路的自編碼器可以有效地提取CSI矩陣的空間區域相關性，基于空洞卷積的DCRNet結構如圖2所示，

圖2 DCRNet的網路結構

在(a)編碼器中，輸入$H_a$的維度為$2×N_a×N_t$，兩個獨立的通道分別代表CSI矩陣的實部和虛部，首先使用5×5的頭卷積來提取和融合CSI矩陣實部和虛部的特征資訊；然后通過一個編碼塊來提取深度的抽象資訊，與ACRNet不同，為了減少復雜度， DCRNet 中的編碼器只需要一個單元就可以得到17 × 17的 RecF，只比ACRNet中RecF的小一點；隨后利用全連接層來把$2×N_a×N_t$的矩陣壓縮成一維的碼字向量，壓縮比$\mathcal {η}∈(0,1)$；最后碼字通過無線信道傳輸到BS的解碼器，

在(b)解碼器中，輸入碼字經過全連接層進行重塑操作；隨后5×5的頭卷積用來增強信道恢復性能；之后兩個空洞卷積解壓塊來恢復壓縮的資訊，其中批歸一化和引數整流線性單元（parametric rectified linear unit，PReLU）激活函式應用到每一層卷積之中，帶有可學習引數$α$的PReLU為：

\[\begin{align*} \text{PReLU}(x)=\left\lbrace \begin{array}{ll}x, & x \geq 0 \\ \alpha x, & x< 0. \end{array}\right. \tag{6} \end{align*} \]

3.2 空洞編碼解碼塊的設計

與傳統卷積不同，空洞卷積帶有特定的間隔$d$，也稱作空洞率，二維空洞卷積運算可以寫作：

\[\begin{align*} (\boldsymbol{I}\circledast \boldsymbol{K})[i,j]=\sum _{u}\sum _{v} {\boldsymbol{I}[i+du,j+dv]\cdot \boldsymbol{K}[u,v]}, \tag{7} \end{align*} \]

其中$\circledast,\boldsymbol{I},\boldsymbol{K}$分別表示空洞卷積操作、二維輸入和卷積核，$u,v$為卷積核$\boldsymbol{K}$的指數，空洞率為$d$的空洞卷積有效卷積核大小表示為：

\[\begin{align*} k_{i}^{\prime }=k_{i}+(k_{i}-1)(d-1), \tag{8} \end{align*} \]

其中$k_i,{k^{'}}_i$為當前使用的卷積核大小和有效的卷積核大小，圖3展示了空洞率不同的空洞卷積，在同樣的卷積核大小下，當$d>1$時，空洞卷積比普通卷積能夠提供更大的感受野，可以實作塊稀疏CSI矩陣的稀疏采樣，

圖3 空洞率為1、2、3時的空洞卷積

1）編碼塊設計

雖然隨著空洞率的增加RecF會變大，但連續使用相同空洞率的空洞卷積會造成網格效應和資訊損失，根據混合空洞卷積和非對稱卷積技術，在編碼器塊中采用了d = 1、d = 2和d = 3的非對稱3×3卷積，如圖2所示，可以驗證編碼塊可以獲得大小為13 × 13的RecF，等于CsiNet+的大小，這不僅可以幫助編碼塊提取大規模資訊，關注區域細節而不產生網格效應，還可以降低計算復雜度，

由于連接不同卷積的特征可以產生CSI的多解析度以提高系統性能，因此對編碼塊執行連接操作，如圖2（c）所示，采用標準3 × 3濾波器作為空洞卷積的補充，編碼塊的輸入將通過兩個并行分支，一個是空洞卷積，另一個是標準3 × 3卷積，然后將它們的輸出進行連接，通過1 × 1卷積將通道數量減少到2，最后根據殘差學習的思想，使編碼塊的輸入添加到1 × 1卷積的輸出中，

2）解碼塊設計

在圖2（d）中，與編碼塊的設計原則類似，在第一個分支中，使用d = 2的3 × 3空洞卷積將特征維數增加到$8ρ$，其中$ρ≥1$為網路寬度擴展率，通過調整擴展率$ρ$，可以使DCRNet-$ρ$ x適用于不同計算能力的模塊，然后使用3×1和1×3且d=3的空洞卷積代替標準9×9的卷積，可以有效的減少計算復雜度，隨后使用3×3的卷積來減少特征通道數到2，

在第二個分支中，不像在編碼塊中只使用一個標準卷積，這里使用了分組卷積和寬度擴展運算，因為BS的計算資源不像UE是有限的，而且寬度擴展運算對于CSI反饋同樣重要，其中，1 × 3和3 × 1濾波器分別用于增加和減少特征維數，5 × 1和1 × 5分組卷積作用與第一個分支中的相似，兩個分支的輸出將被連接在一起，并通過1 × 1的卷積，

由于使用了空洞卷積和多解析度思想，DCRNet比ACRNet的感受野寬得多，而且FLOPs更低，在性能和計算復雜度之間取得了很好的平衡，

4 實驗結果分析

4.1 實驗設定

1）資料

根據COST2100實作室內5.3GHz和室外300MHz的訓練和測驗場景，BS處有$N_t=32$個均勻線性天線陣列和$N_c=1024$個子載波，原始大小為$2×32×1024$的CSI矩陣在轉換到角延遲域處理之后，得到$2×32×32$的CSI矩陣，訓練集、驗證集和測驗集分別為100000、30000和20000，

2）訓練

使用Kaiming initialization來產生每個卷積層和全連接層的權重，還采用了余弦退火學習率來增強網路性能，初始學習率的范圍在$\gamma _{min}=5×10^{-5}$到$\gamma _{max}=2×10^{-3}$之間，學習率可以表示為：

\[\begin{align*} \gamma _{t} =\gamma _{min}+\frac{1}{2}(\gamma _{max}-\gamma _{min})\left(1+\cos \left({\frac{t-T_{w}}{T-T_{w}}\pi }\right)\right), \tag{9} \end{align*} \]

其中，$t$是第$t$個訓練時期，$γ_t$是當前的學習率，$T_w$和$T$分別是預熱時期和總時期的數量，分別設定為30和2500，

3）評估標準

使用歸一化均方誤差（NMSE）來評估輸入CSI矩陣${\boldsymbol{H}_{\boldsymbol{a}}}$和輸出CSI矩陣$\hat{\boldsymbol{H}_{\boldsymbol{a}}}$的區別，由下式給出：

\[\text{NMSE}=\mathbb {E}\left\lbrace {\left\Vert \boldsymbol{H}_{\boldsymbol{a}}-\hat{\boldsymbol{H}_{\boldsymbol{a}}}\right\Vert _{2}^{2}}\Big/{\left\Vert \boldsymbol{H}_{\boldsymbol{a}}\right\Vert _{2}^{2}}\right\rbrace, \]

4.2 DCRnet的性能

將DCRNet與基于DL的CSI反饋網路進行比較，分為低復雜度網路組：CsiNet、CRNet、ACRNet和DCRNet，和高復雜度且高性能組：DCRNet10×、DS-NLCsiNet、SOTA CsiNet+和ACRNet10×，

表1列出了上述幾種CSI反饋網路的性能比較，其中壓縮率$η$分別設定為1/4、1/8、1/16和1/32，最佳結果以粗體顯示，從表1中，可以發現DCRNet-1×具有最低的計算復雜度和最少的引數，而且可以在室內場景下實作了不同壓縮率下的SOTA性能，在室外場景下，DCRNet-1×仍然可以以最低的FLOP實作幾乎相同的SOTA性能，

表1 不同網路的NMSE比較

5 結論

文獻提出了DCRNet，網路采用空洞卷積來增加RecF，同時降低計算復雜度，仿真結果表明了DCRNet1×在計算資源有限的情況下優于其它輕量級網路，而且DCRNet-10×以比傳統網路低得多的計算復雜度實作了幾乎相同的重建性能，

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/551466.html

標籤：其他

上一篇：KubeSphere 社區雙周報 | 杭州站 Meetup 議題征集中 | 2023.04.14-04.27

下一篇：返回列表