經典分類網路結構

學習目標
1. LeNet-5決議
- 1.1 網路結構
- 1.2 引數形狀總結
2. AlexNet
3. 卷積網路結構的優化
- 3.1 常見結構特點
4. Inception 結構
- 4.1 MLP卷積(1x1卷積)
- 4.2 1x1卷積介紹
- 4.3 通道數變化
- 4.4 Inception層
- 4.5 Inception改進
- 4.6 GoogleNet結構
5. 卷積神經網路學習特征可視化
6. 案例：使用pre_trained模型進行VGG預測
7. 總結

學習目標

目標
- 知道LeNet-5網路結構
- 了解經典的分類網路結構
- 知道一些常見的卷機網路結構的優化
  - 知道NIN中1x1卷積原理以及作用
  - 知道Inception的作用
- 了解卷積神經網路學習程序內容

下面我們主要以一些常見的網路結構去決議，并介紹大部分的網路的特點，這里看一下卷積的發展歷史圖，

在這里插入圖片描述

1. LeNet-5決議

首先我們從一個稍微早一些的卷積網路結構LeNet-5（這里稍微改了下名字）,開始的目的是用來識別數字的，從前往后介紹完整的結構組成，并計算相關輸入和輸出，

1.1 網路結構

在這里插入圖片描述

激活層默認不畫網路圖當中，這個網路結構當時使用的是sigmoid和Tanh函式，還沒有出現Relu函式
將卷積、激活、池化視作一層，即使池化沒有引數

1.2 引數形狀總結

	shape	size	parameters
Input	(32,32,3)	3072	0
Conv1(f=5,s=1)	(28,28,6)	4704	450+6
Pool1	(14,14,6)	1176	0
Conv2(f=5,s=1)	(10,10,16)	1600	2400+16
Pool2	(5,5,16)	400	0
FC3	(120,1)	120	48000+120
FC4	(84,1)	84	10080+84
Ouput:softmax	(10,1)	10	840+10

中間的特征大小變化不宜過快

事實上，在過去很多年，許多機構或者學者都發布了各種各樣的網路，其實去了解設計網路最好的辦法就是去研究現有的網路結構或者論文，大多數網路設計出來是為了Image Net的比賽（解決ImageNet中的1000類影像分類或定位問題），后來大家在各個業務上進行使用，

2. AlexNet

2012年，Alex Krizhevsky、Ilya Sutskever在多倫多大學Geoff Hinton的實驗室設計出了一個深層的卷積神經網路AlexNet，奪得了2012年ImageNet LSVRC的冠軍，且準確率遠超第二名（top5錯誤率為15.3%，第二名為26.2%），引起了很大的轟動，AlexNet可以說是具有歷史意義的一個網路結構，

在這里插入圖片描述

總引數量：60M=6000萬，5層卷積+3層全連接
使用了非線性激活函式：ReLU
防止過擬合的方法：Dropout
批標準化層的使用

3. 卷積網路結構的優化

3.1 常見結構特點

整個程序：AlexNet—NIN—(VGG—GoogLeNet)—ResNet

NIN:引入1 * 1卷積
VGG，斬獲2014年分類第二（第一是GoogLeNet），定位任務第一，
- 引數量巨大,140M = 1.4億
- 19layers
- VGG 版本
  - VGG16
  - VGG19

在這里插入圖片描述

GoogleNet，2014年比賽冠軍的model，這個model證明了一件事：用更多的卷積，更深的層次可以得到更好的結構，（當然，它并沒有證明淺的層次不能達到這樣的效果）
- 500萬的引數量
- 22layers
- 引入了Inception模塊
  - Inception V1
  - Inception V2
  - Inception V3
  - Inception V4

在這里插入圖片描述

下面我們將針對卷積網路架構常用的一些結構進行詳細分析，來探究這些結構帶來的好處

4. Inception 結構

首先我們要說一下在Network in Network中引入的1 x 1卷積結構的相關作用

4.1 MLP卷積(1x1卷積)

在這里插入圖片描述

目的:提出了一種新的深度網路結構，稱為“網路中的網路”（NIN），增強接受域內區域貼片的模型判別能力，
做法
- 提出MLP卷積取代傳統線性卷積核
作用或優點：
- 重要作用：1x1的卷積核操作還可以實作卷積核通道數的降維和升維，實作引數的減小化
- 多個1x1的卷積核，提高特征抽象能力（Multilayer Perceptron,縮寫MLP,就是一個多層神經網路）