空洞卷積感受野的正確計算方法
- 空洞卷積介紹
- 計算誤區
- 正確的計算方法
空洞卷積介紹
空洞卷積(dilated convolution)是針對影像語意分割問題中下采樣會降低影像解析度、丟失資訊而提出的一種卷積思路, 利用添加空洞擴大感受野,讓原本3x3的卷積核,在相同引數量和計算量下擁有5x5(dilated rate =2)或者更大的感受野,從而無需下采樣,
具體是在普通卷積中間填充不參與卷積運算的空洞的結構,對于dilation rate=2,3×3大小的卷積核來說,其卷積程序如下圖所示,由圖可以看到,其等效的卷積核大小為5×5,而參與運算的只有部分點,更多的是不參與運算的空洞,

計算誤區
網上很多的感受野計算公式為:
F
=
2
(
r
a
t
e
?
1
)
?
(
k
?
1
)
+
k
F=2(rate-1)*(k-1)+k
F=2(rate?1)?(k?1)+k
rate代表空洞率,k代表卷積核尺寸,這個式子實際計算的是特定的級聯卷積實作的感受野,而非單個空洞卷積,且級聯的卷積選取也必須具有一定規律,以常用的3×3卷積為例,空洞率的選取必須依次為1、2、4、8、16…,對應級聯起來形成的感受野大小為:
dilation=1, F = 2 * (1 - 1) * (3 - 1) + 3 = 3
dilation=2, F = 2 * (2 - 1) * (3 - 1) + 3 = 7
dilation=4, F = 2 * (4 - 1) * (3 - 1) + 3 = 15
dilation=8, F = 2 * (8 - 1) * (3 - 1) + 3 = 31
dilation=16, F = 2 * (16 - 1) * (3 - 1) + 3 = 63
卷積程序示意見下,如圖是依次經過普通卷積,空洞率為2和空洞率為4對應的感受野范圍,

誤區就在這里,參考網上的一些說法,很容易把上述的感受野計算公式當成單獨的空洞卷積形成的感受野,比如,對于空洞率為4的空洞卷積來說,按上圖公式計算得到感受野為15,此感受野其實是了普通卷積和空洞率為2以及空洞率為4的空洞卷積級聯實作的,而非單獨的空洞率為4的卷積,那么,對于單獨空洞卷積形成的感受野大小來說,正確的計算方法應該是什么呢?方法很簡單,見下,
正確的計算方法
要計算感受野大小,我們直接看此空洞卷積等效的卷積核大小是多少就行了,比如對于3×3,空洞率為2的卷積,等效卷積核大小為5×5,那么這個就是它單獨的感受野;如果空洞率為4,則等效的卷積核大小為9×9,即為單獨的感受野,
再回看上面級聯的情況,還是以3×3普通卷積、空洞率為2和空洞率為4的空洞卷積級聯為例,此可以等效為3×3、5×5、9×9的普通卷積級聯,計算感受野程序如下:
3×3, F = 1+(3-1)* 1 = 3
5×5, F = 3 + (5 - 1) * 1 = 7
9×9, F = 7 + (9 - 1) * 1 = 15
結果和之前的級聯空洞卷積計算公式結果一樣,
結論: 計算空洞卷積感受野,直接等效為對應尺寸的普通卷積即可,
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/282242.html
標籤:AI
