卷積神經網路簡介
- 概述
- 架構
- 卷積是什么
- 影像顏色通道
- 特征圖個數
- 堆疊的卷積層
- 卷積層引數
- 步長
- 卷積核尺寸
- 邊界填充
- 卷積核個數
- 卷積結果計算公式
- 卷積引數共享
- 池化層
- 最大池化
- 平均池化 (不推薦)
- 最小池化 (不推薦)
- 特征圖
- 感受野
- 經典網路
- Alexnet 網路
- Vgg 網路
- Resnet 網路
概述
卷積神經網路在 CV 領域, 檢測任務領域, 分類與檢索領域, 圖片重構領域, 醫學任務領域, 無人駕駛領域, 人臉識別領域等等都有廣泛的應用.

卷積神經網路與傳統網路的區別:

架構
整體架構:
- 輸入層
- 卷積層
- 池化層
- 全連接層

卷積是什么
卷積就是一種特殊的加權求和. 卷積是一種混合資訊的手段, 通過對輸入圖片大小相同區塊和卷積核進行點乘然對不同通道后求和.

影像顏色通道
當我們在影像上應用卷積時, 我們分別在 W, L, C 三個維度處理資訊. 輸入的影像由 R, G, B 三個通道組成, 其中每個通道的元素都是[0, 255] 中的一個數, 例如:




特征圖個數





堆疊的卷積層

卷積層引數
引數:
- 滑動視窗步長
- 卷積核尺寸
- 邊緣填充
- 卷積核個數
步長
步長為 1 的卷積:

步長為 2 的卷積:

卷積核尺寸

邊界填充

卷積核個數
有多少個卷積核, 經過卷積就會產生多少個feature map, 也就是下圖中 的層數.

卷積結果計算公式
其中 W1, H1 表示輸入的寬度, 長度; W2, H2 表示輸出特征圖的寬度, 長度. F 表示卷積核長和寬的大小, S 表示滑動視窗的步長, P 表示邊界填充:

卷積引數共享

對于 10 個 553 的卷積核, 每一個卷積核需要 553 = 75個引數. 10 個卷積核就需要1075 = 750個卷積核引數. 在加上每個卷積核一個的b (bias: 偏置) 引數, 最終只需要750+10=760個權重引數. 相較于 3232*3 = 3072 個引數, 引數共享大大降低了引數的數量.

池化層

最大池化

平均池化 (不推薦)

最小池化 (不推薦)

特征圖

感受野
如果堆疊 3 個 33 的卷積層, 并且保持滑動視窗步長為 1, 其感受野就是 77 了. 如下圖所示:

那么我們為什么非要堆疊 3 個 小卷積而不用 7*7 呢?
我們假設輸入大小都是 hwc, 并且都使用 c 個卷積核得到 c 個特征圖. 我們來計算一下 3 個 33 卷積核和 77 卷積核各自所需引數:
- c * 7 * 7 *c = 49 c^2
- 3* c * 3 * 3 *c = 27 c^2
很明顯, 堆疊小的卷積核所需的引數更少一些. 并且卷積核程序越多, 特征提取也會越細, 加入的非線性變化也隨著增多, 同時還不會增大權重個數.
經典網路
Alexnet 網路

Vgg 網路

Resnet 網路



轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/265841.html
標籤:AI
