這篇文章的作者是廣州大學的范立生老師和他的學生湯舜璞,于2022年10月發表在 IEEE TRANSACTIONS ON VEHICULAR TECHNOLOGY,
文獻提出了一種基于空洞卷積(Dilated Convolution)的CSI反饋網路,即空洞信道重建網路(Dilated Channel Reconstruction Network, DCRNet),還設計了編碼器和解碼器塊,提高了重建性能并降低計算復雜度,
1 研究背景
在下行MIMO系統中,利用信道狀態資訊(CSI)是BS完成預編碼設計的前提,在時分雙工(TDD)模式下,由于信道的互易性,BS可以直接獲得下行鏈路的CSI,然而在頻分雙工(FDD)模式下,因為BS由于榷訓易而難以獲得CSI資訊,下行鏈路的CSI必須由UE來估計,但在大規模MIMO系統中,反饋CSI矩陣的開銷隨著天線數量的增加而增加,也受到用戶的發射功率和上行帶寬的限制,因此,需要對反饋CSI進行壓縮,
傳統基于CS的方法如LASSO和BM3D-AMP演算法等存在一些局限性,如假設CSI是理想稀疏的,在隨機工程中忽略了信道統計,迭代處理導致了較大的延遲等,
基于深度學習的方法如CsiNet等,優于傳統的基于CS的演算法,而且可以有效地減小網路引數,這類演算法的主要限制是網路架構不能提供足夠的感受野(receptive field, RecF)*,表明深層神經元不能表示原始輸入的足夠區域,為了克服這種限制,一些論文提出了設計更大的RecF以增加卷積大小來提高CSI重建性能,代價是增加網路的復雜度,因此,設計一種輕量級的網路架構,在較低計算復雜度下提高RecF的同時,又能保持CSI重構的性能,是非常重要的,
文章的主要貢獻有:
- 提出了一種基于擴展卷積的CSI反饋網路DCRNet,該網路在有效壓縮CSI反饋的同時降低了計算復雜度;
- 在不增加卷積大小的情況下,利用擴展卷積增強RecF網路,重新設計了一種先進的編碼器和解碼器塊,以提高重構性能,降低計算復雜度,
*感受野:CNN中每一層輸出的特征圖上的像素點映射回輸入影像上的區域大小,通俗點的解釋是,特征圖上一點,相對于原圖的大小,也是卷積神經網路特征所能看到輸入影像的區域,
2 CSI反饋系統
考慮頻分雙工MIMO下行鏈路,在BS上有\(Nt>>1\)根天線,在每個UE上有1根天線,在OFDM中有\({N}_{\mathrm{c}}\)個子載波,第n個子載波的復值接收信號為:
\[y_n={\mathbf{h}}_n^H \mathbf{b}_n x_n+z_n, \]\({\mathbf{h}}_n \in \mathbb{C}^{N_{\mathrm{t}} \times 1}, (·)^H,\mathbf{b}_n \in \mathbb{C}^{N_{\mathrm{t}} \times 1}, x_n \in \mathbb{C} \text {, 和 } z_n \in \mathbb{C}\)分別表示第\(n\)個子載波上的信道增益向量、共軛轉置、波束成形向量、發射信號和加性高斯白噪聲(AWGN),所有子載波的CSI可表示為矩陣\({\mathbf{H}}=\left[{\mathbf{h}}_1, {\mathbf{h}}_2, \ldots, {\mathbf{h}}_{{N}_c}\right] \in \mathbb{C}^{N_t \times {N}_c}\),其中共有\(2N_cN_t\)個元素,
BS的波束形成和預編碼設計需要CSI矩陣H的反饋,但MIMO的天線數量導致巨大的開銷,為了解決這個問題,需要將CSI矩陣H壓縮后再反饋給BS,CSI反饋模型如圖1所示,

CSI矩陣H首先通過離散傅里葉變換(DFT)從空間域和頻域變換到角域和延遲域,即:
\[\tilde{H}=F_cHF_t^H, \]其中,\(F_c,F_t\)分別為\(Nc × Nc\)和$Nt × Nt \(的DFT變換矩陣,由于多徑到達有延遲區間,矩陣\)\tilde{H}\(在角延遲域中是稀疏的,它可以分為兩部分,一部分是\)H_a\(,其中有\)N_a\(行由非零元素組成(\)N_a < N_c\(),另一部分其余\)N_c?N_a\(行由近零元素組成,把信道矩陣\)H\(壓縮為\)H_a$,而且資訊損失可以忽略不計,
為了進一步壓縮CSI矩陣,還要應用基于深度學習的自編碼壓縮和恢復模塊,如圖1所示,通過編碼器壓縮CSI矩陣輸出較小的碼字向量:
\[\begin{align*} \boldsymbol{v}=\mathcal {E}(\theta _{1},\boldsymbol{H}_{\boldsymbol{a}}), \tag{3} \end{align*} \]其中,\(\mathcal {E}(·)\)代表壓縮操作,\(\theta_1\)代表編碼器的引數,壓縮后的CSI矩陣通過專用的信道反饋給BS,然后BS通過解碼器恢復CSI矩陣:
\[\begin{align*} \hat{\boldsymbol{H}}_{\boldsymbol{a}}=\mathcal {D}(\theta _{2},\boldsymbol{v}), \tag{4} \end{align*} \]其中,\(\mathcal {D}(·)\)代表壓縮操作,\(\theta_2\)代表解碼器的引數,CSI反饋的目的是為了最小化平均重構誤差:
\[\begin{align*} \min _{(\theta _{1},\theta _{2})} \mathbb {E}||\boldsymbol{H}_{\boldsymbol{a}}-\hat{\boldsymbol{H}}_{\boldsymbol{a}}||_{2}, \tag{5} \end{align*} \]3 基于空洞卷積的CSI反饋
3.1 DCRNet的結構
基于卷積神經網路的自編碼器可以有效地提取CSI矩陣的空間區域相關性,基于空洞卷積的DCRNet結構如圖2所示,

在(a)編碼器中,輸入\(H_a\)的維度為\(2×N_a×N_t\),兩個獨立的通道分別代表CSI矩陣的實部和虛部,首先使用5×5的頭卷積來提取和融合CSI矩陣實部和虛部的特征資訊;然后通過一個編碼塊來提取深度的抽象資訊,與ACRNet不同,為了減少復雜度, DCRNet 中的編碼器只需要一個單元就可以得到17 × 17的 RecF,只比ACRNet中RecF的小一點;隨后利用全連接層來把\(2×N_a×N_t\)的矩陣壓縮成一維的碼字向量,壓縮比\(\mathcal {η}∈(0,1)\);最后碼字通過無線信道傳輸到BS的解碼器,
在(b)解碼器中,輸入碼字經過全連接層進行重塑操作;隨后5×5的頭卷積用來增強信道恢復性能;之后兩個空洞卷積解壓塊來恢復壓縮的資訊,其中批歸一化和引數整流線性單元(parametric rectified linear unit,PReLU)激活函式應用到每一層卷積之中,帶有可學習引數\(α\)的PReLU為:
\[\begin{align*} \text{PReLU}(x)=\left\lbrace \begin{array}{ll}x, & x \geq 0 \\ \alpha x, & x< 0. \end{array}\right. \tag{6} \end{align*} \]3.2 空洞編碼解碼塊的設計
與傳統卷積不同,空洞卷積帶有特定的間隔\(d\),也稱作空洞率,二維空洞卷積運算可以寫作:
\[\begin{align*} (\boldsymbol{I}\circledast \boldsymbol{K})[i,j]=\sum _{u}\sum _{v} {\boldsymbol{I}[i+du,j+dv]\cdot \boldsymbol{K}[u,v]}, \tag{7} \end{align*} \]其中\(\circledast,\boldsymbol{I},\boldsymbol{K}\)分別表示空洞卷積操作、二維輸入和卷積核,\(u,v\)為卷積核\(\boldsymbol{K}\)的指數,空洞率為\(d\)的空洞卷積有效卷積核大小表示為:
\[\begin{align*} k_{i}^{\prime }=k_{i}+(k_{i}-1)(d-1), \tag{8} \end{align*} \]其中\(k_i,{k^{'}}_i\)為當前使用的卷積核大小和有效的卷積核大小,圖3展示了空洞率不同的空洞卷積,在同樣的卷積核大小下,當\(d>1\)時,空洞卷積比普通卷積能夠提供更大的感受野,可以實作塊稀疏CSI矩陣的稀疏采樣,

1)編碼塊設計
雖然隨著空洞率的增加RecF會變大,但連續使用相同空洞率的空洞卷積會造成網格效應和資訊損失,根據混合空洞卷積和非對稱卷積技術,在編碼器塊中采用了d = 1、d = 2和d = 3的非對稱3×3卷積,如圖2所示,可以驗證編碼塊可以獲得大小為13 × 13的RecF,等于CsiNet+的大小,這不僅可以幫助編碼塊提取大規模資訊,關注區域細節而不產生網格效應,還可以降低計算復雜度,
由于連接不同卷積的特征可以產生CSI的多解析度以提高系統性能,因此對編碼塊執行連接操作,如圖2(c)所示,采用標準3 × 3濾波器作為空洞卷積的補充,編碼塊的輸入將通過兩個并行分支,一個是空洞卷積,另一個是標準3 × 3卷積,然后將它們的輸出進行連接,通過1 × 1卷積將通道數量減少到2,最后根據殘差學習的思想,使編碼塊的輸入添加到1 × 1卷積的輸出中,
2)解碼塊設計
在圖2(d)中,與編碼塊的設計原則類似,在第一個分支中,使用d = 2的3 × 3空洞卷積將特征維數增加到\(8ρ\),其中\(ρ≥1\)為網路寬度擴展率,通過調整擴展率\(ρ\),可以使DCRNet-\(ρ\) x適用于不同計算能力的模塊,然后使用3×1和1×3且d=3的空洞卷積代替標準9×9的卷積,可以有效的減少計算復雜度,隨后使用3×3的卷積來減少特征通道數到2,
在第二個分支中,不像在編碼塊中只使用一個標準卷積,這里使用了分組卷積和寬度擴展運算,因為BS的計算資源不像UE是有限的,而且寬度擴展運算對于CSI反饋同樣重要,其中,1 × 3和3 × 1濾波器分別用于增加和減少特征維數,5 × 1和1 × 5分組卷積作用與第一個分支中的相似,兩個分支的輸出將被連接在一起,并通過1 × 1的卷積,
由于使用了空洞卷積和多解析度思想,DCRNet比ACRNet的感受野寬得多,而且FLOPs更低,在性能和計算復雜度之間取得了很好的平衡,
4 實驗結果分析
4.1 實驗設定
1)資料
根據COST2100實作室內5.3GHz和室外300MHz的訓練和測驗場景,BS處有\(N_t=32\)個均勻線性天線陣列和\(N_c=1024\)個子載波,原始大小為\(2×32×1024\)的CSI矩陣在轉換到角延遲域處理之后,得到\(2×32×32\)的CSI矩陣,訓練集、驗證集和測驗集分別為100000、30000和20000,
2)訓練
使用Kaiming initialization來產生每個卷積層和全連接層的權重,還采用了余弦退火學習率來增強網路性能,初始學習率的范圍在\(\gamma _{min}=5×10^{-5}\)到\(\gamma _{max}=2×10^{-3}\)之間,學習率可以表示為:
\[\begin{align*} \gamma _{t} =\gamma _{min}+\frac{1}{2}(\gamma _{max}-\gamma _{min})\left(1+\cos \left({\frac{t-T_{w}}{T-T_{w}}\pi }\right)\right), \tag{9} \end{align*} \]其中,\(t\)是第\(t\)個訓練時期,\(γ_t\)是當前的學習率,\(T_w\)和\(T\)分別是預熱時期和總時期的數量,分別設定為30和2500,
3)評估標準
使用歸一化均方誤差(NMSE)來評估輸入CSI矩陣\({\boldsymbol{H}_{\boldsymbol{a}}}\)和輸出CSI矩陣\(\hat{\boldsymbol{H}_{\boldsymbol{a}}}\)的區別,由下式給出:
\[\text{NMSE}=\mathbb {E}\left\lbrace {\left\Vert \boldsymbol{H}_{\boldsymbol{a}}-\hat{\boldsymbol{H}_{\boldsymbol{a}}}\right\Vert _{2}^{2}}\Big/{\left\Vert \boldsymbol{H}_{\boldsymbol{a}}\right\Vert _{2}^{2}}\right\rbrace, \]4.2 DCRnet的性能
將DCRNet與基于DL的CSI反饋網路進行比較,分為低復雜度網路組:CsiNet、CRNet、ACRNet和DCRNet,和高復雜度且高性能組:DCRNet10×、DS-NLCsiNet、SOTA CsiNet+和ACRNet10×,
表1列出了上述幾種CSI反饋網路的性能比較,其中壓縮率\(η\)分別設定為1/4、1/8、1/16和1/32,最佳結果以粗體顯示,從表1中,可以發現DCRNet-1×具有最低的計算復雜度和最少的引數,而且可以在室內場景下實作了不同壓縮率下的SOTA性能,在室外場景下,DCRNet-1×仍然可以以最低的FLOP實作幾乎相同的SOTA性能,

5 結論
文獻提出了DCRNet,網路采用空洞卷積來增加RecF,同時降低計算復雜度,仿真結果表明了DCRNet1×在計算資源有限的情況下優于其它輕量級網路,而且DCRNet-10×以比傳統網路低得多的計算復雜度實作了幾乎相同的重建性能,
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/551466.html
標籤:其他
上一篇:KubeSphere 社區雙周報 | 杭州站 Meetup 議題征集中 | 2023.04.14-04.27
下一篇:返回列表
