Pytorch CIFAR10影像分類 DenseNet篇

文章目錄

Pytorch CIFAR10影像分類 DenseNet篇
- 4.定義網路（DenseNet）
- - DenseNet 的網路結構
  - Bottleneck
  - Transition
  - DenseNet-BC
- 5. 定義損失函式和優化器
- 6. 訓練
- - 損失函式曲線
  - 準確率曲線
  - 學習率曲線
- 7.測驗
- - 查看準確率
  - 查看每一類的準確率
  - 抽樣測驗并可視化一部分結果
- 8. 保存模型
- 9. 預測
- - 讀取本地圖片進行預測
  - 讀取圖片地址進行預測
- 10.總結

這里貼一下匯總篇：匯總篇

4.定義網路（DenseNet）

之前的ResNet通過前層與后層的“短路連接”（Shortcuts），加強了前后層之間的資訊流通，在一定程度上緩解了梯度消失現象，從而可以將神經網路搭建得很深，更進一步，DenseNet最大化了這種前后層資訊交流，通過建立前面所有層與后面層的密集連接，實作了特征在通道維度上的復用，使其可以在引數與計算量更少的情況下實作比ResNet更優的性能，如果想詳細了解并查看論文，可以看我的另一篇博客【論文泛讀】 DenseNet：稠密連接的卷積網路

DenseNet 和 ResNet 不同在于 ResNet 是跨層求和，而 DenseNet 是跨層將特征在通道維度進行拼接，下面可以看看他們兩者的圖示

這個是最標準的卷積神經網路

在這里插入圖片描述

這是ResNet，是跨層求和
在這里插入圖片描述

這個就是DenseNet，是跨層將特征在通道維度進行拼接
在這里插入圖片描述

DenseNet的網路架構如下圖所示，了便于下采樣的實作，我們將網路劃分為多個稠密連接的dense block，網路由多個Dense Block與中間的卷積池化組成，核心就在Dense Block中，Dense Block中的黑點代表一個卷積層，其中的多條黑線代表資料的流動，每一層的輸入由前面的所有卷積層的輸出組成，注意這里使用了通道拼接（Concatnate）操作，而非ResNet的逐元素相加操作，

在這里插入圖片描述

我們將每個block之間的層稱為過渡層
完成卷積和池化的操作，在我們的實驗中，過渡層由BN層、1x1卷積層和2x2平均池化層組成，

在這里插入圖片描述

具體的Block實作細節如下圖所示，每一個Block由若干個Bottleneck的卷積層組成，對應上面圖中的黑點，Bottleneck由BN、ReLU、1×1卷積、BN、ReLU、3×3卷積的順序構成，也被稱為DenseNet-B結構，其中1x1 Conv得到 4k 個特征圖它起到的作用是降低特征數量，從而提升計算效率，

關于Block，有以下4個細節需要注意：

每一個Bottleneck輸出的特征通道數是相同的，例如這里的32，同時可以看到，經過Concatnate操作后的通道數是按32的增長量增加的，因此這個32也被稱為GrowthRate，
這里1×1卷積的作用是固定輸出通道數，達到降維的作用，當幾十個Bottleneck相連接時，Concatnate后的通道數會增加到上千，如果不增加1×1的卷積來降維，后續3×3卷積所需的引數量會急劇增加，1×1卷積的通道數通常是GrowthRate的4倍，
上圖中的特征傳遞方式是直接將前面所有層的特征Concatnate后傳到下一層，這種方式與具體代碼實作的方式是一致的，
Block采用了激活函式在前、卷積層在后的順序，這與一般的網路上是不同的，

DenseNet 的網路結構

在ImageNet資料集上的網路如下圖所示

在這里插入圖片描述

由于我是對CIFAR進行實驗，而論文中給出的是ImageNet的網路模型，所以由于資料集的不同，模型稍微有些不同

在這里插入圖片描述

首先我們還是得判斷是否可以利用GPU，因為GPU的速度可能會比我們用CPU的速度快20-50倍左右，特別是對卷積神經網路來說，更是提升特別明顯，

device = 'cuda' if torch.cuda.is_available() else 'cpu'

Bottleneck

class Bottleneck(nn.Module):
    """
    Dense Block
    這里的growth_rate=out_channels, 就是每個Block自己輸出的通道數，
    先通過1x1卷積層，將通道數縮小為4 * growth_rate，然后再通過3x3卷積層降低到growth_rate，
    """
    # 通常1×1卷積的通道數為GrowthRate的4倍
    expansion = 4
    
    def __init__(self, in_channels, growth_rate):
        super(Bottleneck, self).__init__()
        zip_channels = self.expansion * growth_rate
        self.features = nn.Sequential(
            nn.BatchNorm2d(in_channels),
            nn.ReLU(True),
            nn.Conv2d(in_channels, zip_channels, kernel_size=1, bias=False),
            nn.BatchNorm2d(zip_channels),
            nn.ReLU(True),
            nn.Conv2d(zip_channels, growth_rate, kernel_size=3, padding=1, bias=False)
        )
        
    def forward(self, x):
        out = self.features(x)
        out = torch.cat([out, x], 1)
        return out

我們驗證一下輸出的 channel 是否正確

test_net = Bottleneck(3, 5)
test_x = torch.zeros(1, 3, 32, 32)
print('input shape: {} x {} x {}'.format(test_x.shape[1], test_x.shape[2], test_x.shape[3]))
test_y = test_net(test_x)
print('output shape: {} x {} x {}'.format(test_y.shape[1], test_y.shape[2], test_y.shape[3]))

input shape: 3 x 32 x 32
output shape: 8 x 32 x 32

Transition

class Transition(nn.Module):
    """
    改變維數的Transition層 具體包括BN、ReLU、1×1卷積（Conv）、2×2平均池化操作
    先通過1x1的卷積層減少channels，再通過2x2的平均池化層縮小feature-map
    """
    # 1×1卷積的作用是降維，起到壓縮模型的作用，而平均池化則是降低特征圖的尺寸，
    def __init__(self, in_channels, out_channels):
        super(Transition, self).__init__()
        self.features = nn.Sequential(
            nn.BatchNorm2d(in_channels),
            nn.ReLU(True),
            nn.Conv2d(in_channels, out_channels, kernel_size=1, bias=False),
            nn.AvgPool2d(2)
        )
        
    def forward(self, x):
        out = self.features(x)
        return out

驗證一下過渡層是否正確

test_net = Transition(3, 12)
test_x = torch.zeros(1, 3, 96, 96)
print('input shape: {} x {} x {}'.format(test_x.shape[1], test_x.shape[2], test_x.shape[3]))
test_y = test_net(test_x)
print('output shape: {} x {} x {}'.format(test_y.shape[1], test_y.shape[2], test_y.shape[3]))

input shape: 3 x 96 x 96
output shape: 12 x 48 x 48

DenseNet-BC

# DesneNet-BC
# B 代表 bottleneck layer(BN-RELU-CONV(1x1)-BN-RELU-CONV(3x3))
# C 代表壓縮系數(0<=theta<=1)
import math
class DenseNet(nn.Module):
    """
    Dense Net
    paper中growth_rate取12，維度壓縮的引數θ，即reduction取0.5
    且初始化方法為kaiming_normal()
    num_blocks為每段網路中的DenseBlock數量
    DenseNet和ResNet一樣也是六段式網路（一段卷積+四段Dense+平均池化層），最后FC層，
    第一段將維數從3變到2 * growth_rate
    
    (3, 32, 32) -> [Conv2d] -> (24, 32, 32) -> [layer1] -> (48, 16, 16) -> [layer2]
  ->(96, 8, 8) -> [layer3] -> (192, 4, 4) -> [layer4] -> (384, 4, 4) -> [AvgPool]
  ->(384, 1, 1) -> [Linear] -> (10)
    
    """
    def __init__(self, num_blocks, growth_rate=12, reduction=0.5, num_classes=10):
        super(DenseNet, self).__init__()
        self.growth_rate = growth_rate
        self.reduction = reduction
        
        num_channels = 2 * growth_rate
        
        self.features = nn.Conv2d(3, num_channels, kernel_size=3, padding=1, bias=False)
        self.layer1, num_channels = self._make_dense_layer(num_channels, num_blocks[0])
        self.layer2, num_channels = self._make_dense_layer(num_channels, num_blocks[1])
        self.layer3, num_channels = self._make_dense_layer(num_channels, num_blocks[2])
        self.layer4, num_channels = self._make_dense_layer(num_channels, num_blocks[3], transition=False)
        self.avg_pool = nn.Sequential(
            nn.BatchNorm2d(num_channels),
            nn.ReLU(True),
            nn.AvgPool2d(4),
        )
        self.classifier = nn.Linear(num_channels, num_classes)
        
        self._initialize_weight()
        
    def _make_dense_layer(self, in_channels, nblock, transition=True):
        layers = []
        for i in range(nblock):
            layers += [Bottleneck(in_channels, self.growth_rate)]
            in_channels += self.growth_rate
        out_channels = in_channels
        if transition:
            out_channels = int(math.floor(in_channels * self.reduction))
            layers += [Transition(in_channels, out_channels)]
        return nn.Sequential(*layers), out_channels
    
    def _initialize_weight(self):
        for m in self.modules():
            if isinstance(m, nn.Conv2d):
                nn.init.kaiming_normal_(m.weight.data)
                if m.bias is not None:
                    m.bias.data.zero_()
    
    def forward(self, x):
        out = self.features(x)
        out = self.layer1(out)
        out = self.layer2(out)
        out = self.layer3(out)
        out = self.layer4(out)
        out = self.avg_pool(out)
        out = out.view(out.size(0), -1)
        out = self.classifier(out)
        return out

def DenseNet121():
    return DenseNet([6,12,24,16], growth_rate=32)

def DenseNet169():
    return DenseNet([6,12,32,32], growth_rate=32)

def DenseNet201():
    return DenseNet([6,12,48,32], growth_rate=32)

def DenseNet161():
    return DenseNet([6,12,36,24], growth_rate=48)

def densenet_cifar():
    return DenseNet([6,12,24,16], growth_rate=12)

net = DenseNet121().to(device)

summary(net,(3,32,32))

----------------------------------------------------------------
        Layer (type)               Output Shape         Param #
================================================================
            Conv2d-1           [-1, 64, 32, 32]           1,728
       BatchNorm2d-2           [-1, 64, 32, 32]             128
              ReLU-3           [-1, 64, 32, 32]               0
            Conv2d-4          [-1, 128, 32, 32]           8,192
       BatchNorm2d-5          [-1, 128, 32, 32]             256
              ReLU-6          [-1, 128, 32, 32]               0
            Conv2d-7           [-1, 32, 32, 32]          36,864
        Bottleneck-8           [-1, 96, 32, 32]               0
       BatchNorm2d-9           [-1, 96, 32, 32]             192
             ReLU-10           [-1, 96, 32, 32]               0
           Conv2d-11          [-1, 128, 32, 32]          12,288
      BatchNorm2d-12          [-1, 128, 32, 32]             256
             ReLU-13          [-1, 128, 32, 32]               0
           Conv2d-14           [-1, 32, 32, 32]          36,864
       Bottleneck-15          [-1, 128, 32, 32]               0
      BatchNorm2d-16          [-1, 128, 32, 32]             256
             ReLU-17          [-1, 128, 32, 32]               0
           Conv2d-18          [-1, 128, 32, 32]          16,384
      BatchNorm2d-19          [-1, 128, 32, 32]             256
             ReLU-20          [-1, 128, 32, 32]               0
           Conv2d-21           [-1, 32, 32, 32]          36,864
       Bottleneck-22          [-1, 160, 32, 32]               0
      BatchNorm2d-23          [-1, 160, 32, 32]             320
             ReLU-24          [-1, 160, 32, 32]               0
           Conv2d-25          [-1, 128, 32, 32]          20,480
      BatchNorm2d-26          [-1, 128, 32, 32]             256
             ReLU-27          [-1, 128, 32, 32]               0
           Conv2d-28           [-1, 32, 32, 32]          36,864
       Bottleneck-29          [-1, 192, 32, 32]               0
      BatchNorm2d-30          [-1, 192, 32, 32]             384
             ReLU-31          [-1, 192, 32, 32]               0
           Conv2d-32          [-1, 128, 32, 32]          24,576
      BatchNorm2d-33          [-1, 128, 32, 32]             256
             ReLU-34          [-1, 128, 32, 32]               0
           Conv2d-35           [-1, 32, 32, 32]          36,864
       Bottleneck-36          [-1, 224, 32, 32]               0
      BatchNorm2d-37          [-1, 224, 32, 32]             448
             ReLU-38          [-1, 224, 32, 32]               0
           Conv2d-39          [-1, 128, 32, 32]          28,672
      BatchNorm2d-40          [-1, 128, 32, 32]             256
             ReLU-41          [-1, 128, 32, 32]               0
           Conv2d-42           [-1, 32, 32, 32]          36,864
       Bottleneck-43          [-1, 256, 32, 32]               0
      BatchNorm2d-44          [-1, 256, 32, 32]             512
             ReLU-45          [-1, 256, 32, 32]               0
           Conv2d-46          [-1, 128, 32, 32]          32,768
        AvgPool2d-47          [-1, 128, 16, 16]               0
       Transition-48          [-1, 128, 16, 16]               0
      BatchNorm2d-49          [-1, 128, 16, 16]             256
             ReLU-50          [-1, 128, 16, 16]               0
           Conv2d-51          [-1, 128, 16, 16]          16,384
      BatchNorm2d-52          [-1, 128, 16, 16]             256
             ReLU-53          [-1, 128, 16, 16]               0
           Conv2d-54           [-1, 32, 16, 16]          36,864
       Bottleneck-55          [-1, 160, 16, 16]               0
      BatchNorm2d-56          [-1, 160, 16, 16]             320
             ReLU-57          [-1, 160, 16, 16]               0
           Conv2d-58          [-1, 128, 16, 16]          20,480
      BatchNorm2d-59          [-1, 128, 16, 16]             256
             ReLU-60          [-1, 128, 16, 16]               0
           Conv2d-61           [-1, 32, 16, 16]          36,864
       Bottleneck-62          [-1, 192, 16, 16]               0
      BatchNorm2d-63          [-1, 192, 16, 16]             384
             ReLU-64          [-1, 192, 16, 16]               0
           Conv2d-65          [-1, 128, 16, 16]          24,576
      BatchNorm2d-66          [-1, 128, 16, 16]             256
             ReLU-67          [-1, 128, 16, 16]               0
           Conv2d-68           [-1, 32, 16, 16]          36,864
       Bottleneck-69          [-1, 224, 16, 16]               0
      BatchNorm2d-70          [-1, 224, 16, 16]             448
             ReLU-71          [-1, 224, 16, 16]               0
           Conv2d-72          [-1, 128, 16, 16]          28,672
      BatchNorm2d-73          [-1, 128, 16, 16]             256
             ReLU-74          [-1, 128, 16, 16]               0
           Conv2d-75           [-1, 32, 16, 16]          36,864
       Bottleneck-76          [-1, 256, 16, 16]               0
      BatchNorm2d-77          [-1, 256, 16, 16]             512
             ReLU-78          [-1, 256, 16, 16]               0
           Conv2d-79          [-1, 128, 16, 16]          32,768
      BatchNorm2d-80          [-1, 128, 16, 16]             256
             ReLU-81          [-1, 128, 16, 16]               0
           Conv2d-82           [-1, 32, 16, 16]          36,864
       Bottleneck-83          [-1, 288, 16, 16]               0
      BatchNorm2d-84          [-1, 288, 16, 16]             576
             ReLU-85          [-1, 288, 16, 16]               0
           Conv2d-86          [-1, 128, 16, 16]          36,864
      BatchNorm2d-87          [-1, 128, 16, 16]             256
             ReLU-88          [-1, 128, 16, 16]               0
           Conv2d-89           [-1, 32, 16, 16]          36,864
       Bottleneck-90          [-1, 320, 16, 16]               0
      BatchNorm2d-91          [-1, 320, 16, 16]             640
             ReLU-92          [-1, 320, 16, 16]               0
           Conv2d-93          [-1, 128, 16, 16]          40,960
      BatchNorm2d-94          [-1, 128, 16, 16]             256
             ReLU-95          [-1, 128, 16, 16]               0
           Conv2d-96           [-1, 32, 16, 16]          36,864
       Bottleneck-97          [-1, 352, 16, 16]               0
      BatchNorm2d-98          [-1, 352, 16, 16]             704
             ReLU-99          [-1, 352, 16, 16]               0
          Conv2d-100          [-1, 128, 16, 16]          45,056
     BatchNorm2d-101          [-1, 128, 16, 16]             256
            ReLU-102          [-1, 128, 16, 16]               0
          Conv2d-103           [-1, 32, 16, 16]          36,864
      Bottleneck-104          [-1, 384, 16, 16]               0
     BatchNorm2d-105          [-1, 384, 16, 16]             768
            ReLU-106          [-1, 384, 16, 16]               0
          Conv2d-107          [-1, 128, 16, 16]          49,152
     BatchNorm2d-108          [-1, 128, 16, 16]             256
            ReLU-109          [-1, 128, 16, 16]               0
          Conv2d-110           [-1, 32, 16, 16]          36,864
      Bottleneck-111          [-1, 416, 16, 16]               0
     BatchNorm2d-112          [-1, 416, 16, 16]             832
            ReLU-113          [-1, 416, 16, 16]               0
          Conv2d-114          [-1, 128, 16, 16]          53,248
     BatchNorm2d-115          [-1, 128, 16, 16]             256
            ReLU-116          [-1, 128, 16, 16]               0
          Conv2d-117           [-1, 32, 16, 16]          36,864
      Bottleneck-118          [-1, 448, 16, 16]               0
     BatchNorm2d-119          [-1, 448, 16, 16]             896
            ReLU-120          [-1, 448, 16, 16]               0
          Conv2d-121          [-1, 128, 16, 16]          57,344
     BatchNorm2d-122          [-1, 128, 16, 16]             256
            ReLU-123          [-1, 128, 16, 16]               0
          Conv2d-124           [-1, 32, 16, 16]          36,864
      Bottleneck-125          [-1, 480, 16, 16]               0
     BatchNorm2d-126          [-1, 480, 16, 16]             960
            ReLU-127          [-1, 480, 16, 16]               0
          Conv2d-128          [-1, 128, 16, 16]          61,440
     BatchNorm2d-129          [-1, 128, 16, 16]             256
            ReLU-130          [-1, 128, 16, 16]               0
          Conv2d-131           [-1, 32, 16, 16]          36,864
      Bottleneck-132          [-1, 512, 16, 16]               0
     BatchNorm2d-133          [-1, 512, 16, 16]           1,024
            ReLU-134          [-1, 512, 16, 16]               0
          Conv2d-135          [-1, 256, 16, 16]         131,072
       AvgPool2d-136            [-1, 256, 8, 8]               0
      Transition-137            [-1, 256, 8, 8]               0
     BatchNorm2d-138            [-1, 256, 8, 8]             512
            ReLU-139            [-1, 256, 8, 8]               0
          Conv2d-140            [-1, 128, 8, 8]          32,768
     BatchNorm2d-141            [-1, 128, 8, 8]             256
            ReLU-142            [-1, 128, 8, 8]               0
          Conv2d-143             [-1, 32, 8, 8]          36,864
      Bottleneck-144            [-1, 288, 8, 8]               0
     BatchNorm2d-145            [-1, 288, 8, 8]             576
            ReLU-146            [-1, 288, 8, 8]               0
          Conv2d-147            [-1, 128, 8, 8]          36,864
     BatchNorm2d-148            [-1, 128, 8, 8]             256
            ReLU-149            [-1, 128, 8, 8]               0
          Conv2d-150             [-1, 32, 8, 8]          36,864
      Bottleneck-151            [-1, 320, 8, 8]               0
     BatchNorm2d-152            [-1, 320, 8, 8]             640
            ReLU-153            [-1, 320, 8, 8]               0
          Conv2d-154            [-1, 128, 8, 8]          40,960
     BatchNorm2d-155            [-1, 128, 8, 8]             256
            ReLU-156            [-1, 128, 8, 8]               0
          Conv2d-157             [-1, 32, 8, 8]          36,864
      Bottleneck-158            [-1, 352, 8, 8]               0
     BatchNorm2d-159            [-1, 352, 8, 8]             704
            ReLU-160            [-1, 352, 8, 8]               0
          Conv2d-161            [-1, 128, 8, 8]          45,056
     BatchNorm2d-162            [-1, 128, 8, 8]             256
            ReLU-163            [-1, 128, 8, 8]               0
          Conv2d-164             [-1, 32, 8, 8]          36,864
      Bottleneck-165            [-1, 384, 8, 8]               0
     BatchNorm2d-166            [-1, 384, 8, 8]             768
            ReLU-167            [-1, 384, 8, 8]               0
          Conv2d-168            [-1, 128, 8, 8]          49,152
     BatchNorm2d-169            [-1, 128, 8, 8]             256
            ReLU-170            [-1, 128, 8, 8]               0
          Conv2d-171             [-1, 32, 8, 8]          36,864
      Bottleneck-172            [-1, 416, 8, 8]               0
     BatchNorm2d-173            [-1, 416, 8, 8]             832
            ReLU-174            [-1, 416, 8, 8]               0
          Conv2d-175            [-1, 128, 8, 8]          53,248
     BatchNorm2d-176            [-1, 128, 8, 8]             256
            ReLU-177            [-1, 128, 8, 8]               0
          Conv2d-178             [-1, 32, 8, 8]          36,864
      Bottleneck-179            [-1, 448, 8, 8]               0
     BatchNorm2d-180            [-1, 448, 8, 8]             896
            ReLU-181            [-1, 448, 8, 8]               0
          Conv2d-182            [-1, 128, 8, 8]          57,344
     BatchNorm2d-183            [-1, 128, 8, 8]             256
            ReLU-184            [-1, 128, 8, 8]               0
          Conv2d-185             [-1, 32, 8, 8]          36,864
      Bottleneck-186            [-1, 480, 8, 8]               0
     BatchNorm2d-187            [-1, 480, 8, 8]             960
            ReLU-188            [-1, 480, 8, 8]               0
          Conv2d-189            [-1, 128, 8, 8]          61,440
     BatchNorm2d-190            [-1, 128, 8, 8]             256
            ReLU-191            [-1, 128, 8, 8]               0
          Conv2d-192             [-1, 32, 8, 8]          36,864
      Bottleneck-193            [-1, 512, 8, 8]               0
     BatchNorm2d-194            [-1, 512, 8, 8]           1,024
            ReLU-195            [-1, 512, 8, 8]               0
          Conv2d-196            [-1, 128, 8, 8]          65,536
     BatchNorm2d-197            [-1, 128, 8, 8]             256
            ReLU-198            [-1, 128, 8, 8]               0
          Conv2d-199             [-1, 32, 8, 8]          36,864
      Bottleneck-200            [-1, 544, 8, 8]               0
     BatchNorm2d-201            [-1, 544, 8, 8]           1,088
            ReLU-202            [-1, 544, 8, 8]               0
          Conv2d-203            [-1, 128, 8, 8]          69,632
     BatchNorm2d-204            [-1, 128, 8, 8]             256
            ReLU-205            [-1, 128, 8, 8]               0
          Conv2d-206             [-1, 32, 8, 8]          36,864
      Bottleneck-207            [-1, 576, 8, 8]               0
     BatchNorm2d-208            [-1, 576, 8, 8]           1,152
            ReLU-209            [-1, 576, 8, 8]               0
          Conv2d-210            [-1, 128, 8, 8]          73,728
     BatchNorm2d-211            [-1, 128, 8, 8]             256
            ReLU-212            [-1, 128, 8, 8]               0
          Conv2d-213             [-1, 32, 8, 8]          36,864
      Bottleneck-214            [-1, 608, 8, 8]               0
     BatchNorm2d-215            [-1, 608, 8, 8]           1,216
            ReLU-216            [-1, 608, 8, 8]               0
          Conv2d-217            [-1, 128, 8, 8]          77,824
     BatchNorm2d-218            [-1, 128, 8, 8]             256
            ReLU-219            [-1, 128, 8, 8]               0
          Conv2d-220             [-1, 32, 8, 8]          36,864
      Bottleneck-221            [-1, 640, 8, 8]               0
     BatchNorm2d-222            [-1, 640, 8, 8]           1,280
            ReLU-223            [-1, 640, 8, 8]               0
          Conv2d-224            [-1, 128, 8, 8]          81,920
     BatchNorm2d-225            [-1, 128, 8, 8]             256
            ReLU-226            [-1, 128, 8, 8]               0
          Conv2d-227             [-1, 32, 8, 8]          36,864
      Bottleneck-228            [-1, 672, 8, 8]               0
     BatchNorm2d-229            [-1, 672, 8, 8]           1,344
            ReLU-230            [-1, 672, 8, 8]               0
          Conv2d-231            [-1, 128, 8, 8]          86,016
     BatchNorm2d-232            [-1, 128, 8, 8]             256
            ReLU-233            [-1, 128, 8, 8]               0
          Conv2d-234             [-1, 32, 8, 8]          36,864
      Bottleneck-235            [-1, 704, 8, 8]               0
     BatchNorm2d-236            [-1, 704, 8, 8]           1,408
            ReLU-237            [-1, 704, 8, 8]               0
          Conv2d-238            [-1, 128, 8, 8]          90,112
     BatchNorm2d-239            [-1, 128, 8, 8]             256
            ReLU-240            [-1, 128, 8, 8]               0
          Conv2d-241             [-1, 32, 8, 8]          36,864
      Bottleneck-242            [-1, 736, 8, 8]               0
     BatchNorm2d-243            [-1, 736, 8, 8]           1,472
            ReLU-244            [-1, 736, 8, 8]               0
          Conv2d-245            [-1, 128, 8, 8]          94,208
     BatchNorm2d-246            [-1, 128, 8, 8]             256
            ReLU-247            [-1, 128, 8, 8]               0
          Conv2d-248             [-1, 32, 8, 8]          36,864
      Bottleneck-249            [-1, 768, 8, 8]               0
     BatchNorm2d-250            [-1, 768, 8, 8]           1,536
            ReLU-251            [-1, 768, 8, 8]               0
          Conv2d-252            [-1, 128, 8, 8]          98,304
     BatchNorm2d-253            [-1, 128, 8, 8]             256
            ReLU-254            [-1, 128, 8, 8]               0
          Conv2d-255             [-1, 32, 8, 8]          36,864
      Bottleneck-256            [-1, 800, 8, 8]               0
     BatchNorm2d-257            [-1, 800, 8, 8]           1,600
            ReLU-258            [-1, 800, 8, 8]               0
          Conv2d-259            [-1, 128, 8, 8]         102,400
     BatchNorm2d-260            [-1, 128, 8, 8]             256
            ReLU-261            [-1, 128, 8, 8]               0
          Conv2d-262             [-1, 32, 8, 8]          36,864
      Bottleneck-263            [-1, 832, 8, 8]               0
     BatchNorm2d-264            [-1, 832, 8, 8]           1,664
            ReLU-265            [-1, 832, 8, 8]               0
          Conv2d-266            [-1, 128, 8, 8]         106,496
     BatchNorm2d-267            [-1, 128, 8, 8]             256
            ReLU-268            [-1, 128, 8, 8]               0
          Conv2d-269             [-1, 32, 8, 8]          36,864
      Bottleneck-270            [-1, 864, 8, 8]               0
     BatchNorm2d-271            [-1, 864, 8, 8]           1,728
            ReLU-272            [-1, 864, 8, 8]               0
          Conv2d-273            [-1, 128, 8, 8]         110,592
     BatchNorm2d-274            [-1, 128, 8, 8]             256
            ReLU-275            [-1, 128, 8, 8]               0
          Conv2d-276             [-1, 32, 8, 8]          36,864
      Bottleneck-277            [-1, 896, 8, 8]               0
     BatchNorm2d-278            [-1, 896, 8, 8]           1,792
            ReLU-279            [-1, 896, 8, 8]               0
          Conv2d-280            [-1, 128, 8, 8]         114,688
     BatchNorm2d-281            [-1, 128, 8, 8]             256
            ReLU-282            [-1, 128, 8, 8]               0
          Conv2d-283             [-1, 32, 8, 8]          36,864
      Bottleneck-284            [-1, 928, 8, 8]               0
     BatchNorm2d-285            [-1, 928, 8, 8]           1,856
            ReLU-286            [-1, 928, 8, 8]               0
          Conv2d-287            [-1, 128, 8, 8]         118,784
     BatchNorm2d-288            [-1, 128, 8, 8]             256
            ReLU-289            [-1, 128, 8, 8]               0
          Conv2d-290             [-1, 32, 8, 8]          36,864
      Bottleneck-291            [-1, 960, 8, 8]               0
     BatchNorm2d-292            [-1, 960, 8, 8]           1,920
            ReLU-293            [-1, 960, 8, 8]               0
          Conv2d-294            [-1, 128, 8, 8]         122,880
     BatchNorm2d-295            [-1, 128, 8, 8]             256
            ReLU-296            [-1, 128, 8, 8]               0
          Conv2d-297             [-1, 32, 8, 8]          36,864
      Bottleneck-298            [-1, 992, 8, 8]               0
     BatchNorm2d-299            [-1, 992, 8, 8]           1,984
            ReLU-300            [-1, 992, 8, 8]               0
          Conv2d-301            [-1, 128, 8, 8]         126,976
     BatchNorm2d-302            [-1, 128, 8, 8]             256
            ReLU-303            [-1, 128, 8, 8]               0
          Conv2d-304             [-1, 32, 8, 8]          36,864
      Bottleneck-305           [-1, 1024, 8, 8]               0
     BatchNorm2d-306           [-1, 1024, 8, 8]           2,048
            ReLU-307           [-1, 1024, 8, 8]               0
          Conv2d-308            [-1, 512, 8, 8]         524,288
       AvgPool2d-309            [-1, 512, 4, 4]               0
      Transition-310            [-1, 512, 4, 4]               0
     BatchNorm2d-311            [-1, 512, 4, 4]           1,024
            ReLU-312            [-1, 512, 4, 4]               0
          Conv2d-313            [-1, 128, 4, 4]          65,536
     BatchNorm2d-314            [-1, 128, 4, 4]             256
            ReLU-315            [-1, 128, 4, 4]               0
          Conv2d-316             [-1, 32, 4, 4]          36,864
      Bottleneck-317            [-1, 544, 4, 4]               0
     BatchNorm2d-318            [-1, 544, 4, 4]           1,088
            ReLU-319            [-1, 544, 4, 4]               0
          Conv2d-320            [-1, 128, 4, 4]          69,632
     BatchNorm2d-321            [-1, 128, 4, 4]             256
            ReLU-322            [-1, 128, 4, 4]               0
          Conv2d-323             [-1, 32, 4, 4]          36,864
      Bottleneck-324            [-1, 576, 4, 4]               0
     BatchNorm2d-325            [-1, 576, 4, 4]           1,152
            ReLU-326            [-1, 576, 4, 4]               0
          Conv2d-327            [-1, 128, 4, 4]          73,728
     BatchNorm2d-328            [-1, 128, 4, 4]             256
            ReLU-329            [-1, 128, 4, 4]               0
          Conv2d-330             [-1, 32, 4, 4]          36,864
      Bottleneck-331            [-1, 608, 4, 4]               0
     BatchNorm2d-332            [-1, 608, 4, 4]           1,216
            ReLU-333            [-1, 608, 4, 4]               0
          Conv2d-334            [-1, 128, 4, 4]          77,824
     BatchNorm2d-335            [-1, 128, 4, 4]             256
            ReLU-336            [-1, 128, 4, 4]               0
          Conv2d-337             [-1, 32, 4, 4]          36,864
      Bottleneck-338            [-1, 640, 4, 4]               0
     BatchNorm2d-339            [-1, 640, 4, 4]           1,280
            ReLU-340            [-1, 640, 4, 4]               0
          Conv2d-341            [-1, 128, 4, 4]          81,920
     BatchNorm2d-342            [-1, 128, 4, 4]             256
            ReLU-343            [-1, 128, 4, 4]               0
          Conv2d-344             [-1, 32, 4, 4]          36,864
      Bottleneck-345            [-1, 672, 4, 4]               0
     BatchNorm2d-346            [-1, 672, 4, 4]           1,344
            ReLU-347            [-1, 672, 4, 4]               0
          Conv2d-348            [-1, 128, 4, 4]          86,016
     BatchNorm2d-349            [-1, 128, 4, 4]             256
            ReLU-350            [-1, 128, 4, 4]               0
          Conv2d-351             [-1, 32, 4, 4]          36,864
      Bottleneck-352            [-1, 704, 4, 4]               0
     BatchNorm2d-353            [-1, 704, 4, 4]           1,408
            ReLU-354            [-1, 704, 4, 4]               0
          Conv2d-355            [-1, 128, 4, 4]          90,112
     BatchNorm2d-356            [-1, 128, 4, 4]             256
            ReLU-357            [-1, 128, 4, 4]               0
          Conv2d-358             [-1, 32, 4, 4]          36,864
      Bottleneck-359            [-1, 736, 4, 4]               0
     BatchNorm2d-360            [-1, 736, 4, 4]           1,472
            ReLU-361            [-1, 736, 4, 4]               0
          Conv2d-362            [-1, 128, 4, 4]          94,208
     BatchNorm2d-363            [-1, 128, 4, 4]             256
            ReLU-364            [-1, 128, 4, 4]               0
          Conv2d-365             [-1, 32, 4, 4]          36,864
      Bottleneck-366            [-1, 768, 4, 4]               0
     BatchNorm2d-367            [-1, 768, 4, 4]           1,536
            ReLU-368            [-1, 768, 4, 4]               0
          Conv2d-369            [-1, 128, 4, 4]          98,304
     BatchNorm2d-370            [-1, 128, 4, 4]             256
            ReLU-371            [-1, 128, 4, 4]               0
          Conv2d-372             [-1, 32, 4, 4]          36,864
      Bottleneck-373            [-1, 800, 4, 4]               0
     BatchNorm2d-374            [-1, 800, 4, 4]           1,600
            ReLU-375            [-1, 800, 4, 4]               0
          Conv2d-376            [-1, 128, 4, 4]         102,400
     BatchNorm2d-377            [-1, 128, 4, 4]             256
            ReLU-378            [-1, 128, 4, 4]               0
          Conv2d-379             [-1, 32, 4, 4]          36,864
      Bottleneck-380            [-1, 832, 4, 4]               0
     BatchNorm2d-381            [-1, 832, 4, 4]           1,664
            ReLU-382            [-1, 832, 4, 4]               0
          Conv2d-383            [-1, 128, 4, 4]         106,496
     BatchNorm2d-384            [-1, 128, 4, 4]             256
            ReLU-385            [-1, 128, 4, 4]               0
          Conv2d-386             [-1, 32, 4, 4]          36,864
      Bottleneck-387            [-1, 864, 4, 4]               0
     BatchNorm2d-388            [-1, 864, 4, 4]           1,728
            ReLU-389            [-1, 864, 4, 4]               0
          Conv2d-390            [-1, 128, 4, 4]         110,592
     BatchNorm2d-391            [-1, 128, 4, 4]             256
            ReLU-392            [-1, 128, 4, 4]               0
          Conv2d-393             [-1, 32, 4, 4]          36,864
      Bottleneck-394            [-1, 896, 4, 4]               0
     BatchNorm2d-395            [-1, 896, 4, 4]           1,792
            ReLU-396            [-1, 896, 4, 4]               0
          Conv2d-397            [-1, 128, 4, 4]         114,688
     BatchNorm2d-398            [-1, 128, 4, 4]             256
            ReLU-399            [-1, 128, 4, 4]               0
          Conv2d-400             [-1, 32, 4, 4]          36,864
      Bottleneck-401            [-1, 928, 4, 4]               0
     BatchNorm2d-402            [-1, 928, 4, 4]           1,856
            ReLU-403            [-1, 928, 4, 4]               0
          Conv2d-404            [-1, 128, 4, 4]         118,784
     BatchNorm2d-405            [-1, 128, 4, 4]             256
            ReLU-406            [-1, 128, 4, 4]               0
          Conv2d-407             [-1, 32, 4, 4]          36,864
      Bottleneck-408            [-1, 960, 4, 4]               0
     BatchNorm2d-409            [-1, 960, 4, 4]           1,920
            ReLU-410            [-1, 960, 4, 4]               0
          Conv2d-411            [-1, 128, 4, 4]         122,880
     BatchNorm2d-412            [-1, 128, 4, 4]             256
            ReLU-413            [-1, 128, 4, 4]               0
          Conv2d-414             [-1, 32, 4, 4]          36,864
      Bottleneck-415            [-1, 992, 4, 4]               0
     BatchNorm2d-416            [-1, 992, 4, 4]           1,984
            ReLU-417            [-1, 992, 4, 4]               0
          Conv2d-418            [-1, 128, 4, 4]         126,976
     BatchNorm2d-419            [-1, 128, 4, 4]             256
            ReLU-420            [-1, 128, 4, 4]               0
          Conv2d-421             [-1, 32, 4, 4]          36,864
      Bottleneck-422           [-1, 1024, 4, 4]               0
     BatchNorm2d-423           [-1, 1024, 4, 4]           2,048
            ReLU-424           [-1, 1024, 4, 4]               0
       AvgPool2d-425           [-1, 1024, 1, 1]               0
          Linear-426                   [-1, 10]          10,250
================================================================
Total params: 6,956,298
Trainable params: 6,956,298
Non-trainable params: 0
----------------------------------------------------------------
Input size (MB): 0.01
Forward/backward pass size (MB): 115.98
Params size (MB): 26.54
Estimated Total Size (MB): 142.52
----------------------------------------------------------------

首先從我們summary可以看到，我們定義的模型的引數大概是6 millions，我們輸入的是（batch，3，32，32）的張量，并且這里也能看到每一層后我們的影像輸出大小的變化，最后輸出10個引數，再通過softmax函式就可以得到我們每個類別的概率了，

我們也可以列印出我們的模型觀察一下

DenseNet(
  (features): Conv2d(3, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
  (layer1): Sequential(
    (0): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(64, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (1): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(96, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(96, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (2): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(128, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (3): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(160, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(160, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (4): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(192, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(192, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (5): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(224, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(224, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (6): Transition(
      (features): Sequential(
        (0): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(256, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): AvgPool2d(kernel_size=2, stride=2, padding=0)
      )
    )
  )
  (layer2): Sequential(
    (0): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(128, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (1): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(160, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(160, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (2): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(192, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(192, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (3): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(224, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(224, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (4): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(256, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (5): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(288, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(288, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (6): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(320, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(320, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (7): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(352, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(352, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (8): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(384, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(384, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (9): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(416, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(416, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (10): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(448, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(448, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (11): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(480, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(480, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (12): Transition(
      (features): Sequential(
        (0): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(512, 256, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): AvgPool2d(kernel_size=2, stride=2, padding=0)
      )
    )
  )
  (layer3): Sequential(
    (0): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(256, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (1): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(288, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(288, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (2): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(320, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(320, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (3): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(352, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(352, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (4): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(384, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(384, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (5): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(416, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(416, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (6): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(448, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(448, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (7): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(480, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(480, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (8): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(512, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (9): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(544, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(544, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (10): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(576, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(576, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (11): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(608, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(608, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (12): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(640, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(640, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (13): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(672, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(672, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (14): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(704, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(704, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (15): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(736, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(736, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (16): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(768, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(768, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (17): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(800, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(800, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (18): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(832, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(832, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (19): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(864, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(864, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (20): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(896, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(896, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (21): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(928, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(928, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (22): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(960, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(960, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (23): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(992, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(992, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (24): Transition(
      (features): Sequential(
        (0): BatchNorm2d(1024, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(1024, 512, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): AvgPool2d(kernel_size=2, stride=2, padding=0)
      )
    )
  )
  (layer4): Sequential(
    (0): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(512, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (1): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(544, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(544, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (2): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(576, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(576, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (3): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(608, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(608, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (4): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(640, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(640, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (5): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(672, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(672, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (6): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(704, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(704, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (7): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(736, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(736, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (8): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(768, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(768, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (9): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(800, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(800, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (10): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(832, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(832, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (11): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(864, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(864, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (12): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(896, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(896, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (13): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(928, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(928, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (14): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(960, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(960, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
    (15): Bottleneck(
      (features): Sequential(
        (0): BatchNorm2d(992, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (1): ReLU(inplace=True)
        (2): Conv2d(992, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (4): ReLU(inplace=True)
        (5): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
    )
  )
  (avg_pool): Sequential(
    (0): BatchNorm2d(1024, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (1): ReLU(inplace=True)
    (2): AvgPool2d(kernel_size=4, stride=4, padding=0)
  )
  (classifier): Linear(in_features=1024, out_features=10, bias=True)
)

# 測驗
x = torch.randn(2, 3, 32, 32).to(device)
y = net(x)
print(y.shape)

torch.Size([2, 10])

如果你的電腦有多個GPU，這段代碼可以利用GPU進行并行計算，加快運算速度

net = densenet_cifar().to(device)
if device == 'cuda':
    net = nn.DataParallel(net)
    # 當計算圖不會改變的時候（每次輸入形狀相同，模型不改變）的情況下可以提高性能，反之則降低性能
    torch.backends.cudnn.benchmark = True

5. 定義損失函式和優化器

pytorch將深度學習中常用的優化方法全部封裝在torch.optim之中，所有的優化方法都是繼承基類optim.Optimizier
損失函式是封裝在神經網路工具箱nn中的,包含很多損失函式

這里我使用的是SGD + momentum演算法，并且我們損失函式定義為交叉熵函式，除此之外學習策略定義為動態更新學習率，如果5次迭代后，訓練的損失并沒有下降，那么我們便會更改學習率，會變為原來的0.5倍，最小降低到0.00001

如果想更加了解優化器和學習率策略的話，可以參考以下資料

Pytorch Note15 優化演算法1 梯度下降（Gradient descent varients）
Pytorch Note16 優化演算法2 動量法(Momentum)
Pytorch Note34 學習率衰減

這里決定迭代20次

import torch.optim as optim
optimizer = optim.SGD(net.parameters(), lr=1e-1, momentum=0.9, weight_decay=1e-4)
criterion = nn.CrossEntropyLoss()
# scheduler = optim.lr_scheduler.ReduceLROnPlateau(optimizer, 'min', factor=0.5,verbose=True,patience = 5,min_lr = 0.000001) # 動態更新學習率
scheduler = optim.lr_scheduler.MultiStepLR(optimizer, milestones=[10, 15], gamma=0.1)

import time
epoch = 20

6. 訓練

首先定義模型保存的位置

import os
if not os.path.exists('./model'):
    os.makedirs('./model')
else:
    print('檔案已存在')
save_path = './model/Denset.pth'

我定義了一個train函式，在train函式中進行一個訓練，并保存我們訓練后的模型

from utils import train2
from utils import plot_history
Acc, Loss, Lr = train2(net, trainloader, testloader, epoch, optimizer, criterion, scheduler, save_path, verbose = True)

Epoch [  1/ 20]  Train Loss:1.457685  Train Acc:46.79% Test Loss:1.159939  Test Acc:58.61%  Learning Rate:0.100000	Time 03:26
Epoch [  2/ 20]  Train Loss:0.918042  Train Acc:67.23% Test Loss:0.978080  Test Acc:66.76%  Learning Rate:0.100000	Time 03:26
Epoch [  3/ 20]  Train Loss:0.713618  Train Acc:75.13% Test Loss:0.702649  Test Acc:75.79%  Learning Rate:0.100000	Time 03:14
Epoch [  4/ 20]  Train Loss:0.586451  Train Acc:79.65% Test Loss:0.621467  Test Acc:78.59%  Learning Rate:0.100000	Time 03:21
Epoch [  5/ 20]  Train Loss:0.516065  Train Acc:82.01% Test Loss:0.571210  Test Acc:80.01%  Learning Rate:0.100000	Time 03:21
Epoch [  6/ 20]  Train Loss:0.470830  Train Acc:83.65% Test Loss:0.538970  Test Acc:81.71%  Learning Rate:0.100000	Time 03:26
Epoch [  7/ 20]  Train Loss:0.424286  Train Acc:85.22% Test Loss:0.497426  Test Acc:82.99%  Learning Rate:0.100000	Time 03:10
Epoch [  8/ 20]  Train Loss:0.398347  Train Acc:86.05% Test Loss:0.481514  Test Acc:83.75%  Learning Rate:0.100000	Time 03:33
Epoch [  9/ 20]  Train Loss:0.375151  Train Acc:86.94% Test Loss:0.484835  Test Acc:83.61%  Learning Rate:0.100000	Time 03:40
Epoch [ 10/ 20]  Train Loss:0.355356  Train Acc:87.74% Test Loss:0.495134  Test Acc:83.57%  Learning Rate:0.100000	Time 03:33
Epoch [ 11/ 20]  Train Loss:0.241889  Train Acc:91.73% Test Loss:0.331097  Test Acc:88.66%  Learning Rate:0.010000	Time 03:37
Epoch [ 12/ 20]  Train Loss:0.211223  Train Acc:92.83% Test Loss:0.320972  Test Acc:89.12%  Learning Rate:0.010000	Time 03:22
Epoch [ 13/ 20]  Train Loss:0.195006  Train Acc:93.34% Test Loss:0.306602  Test Acc:89.39%  Learning Rate:0.010000	Time 03:09
Epoch [ 14/ 20]  Train Loss:0.183884  Train Acc:93.63% Test Loss:0.306510  Test Acc:89.98%  Learning Rate:0.010000	Time 03:12
Epoch [ 15/ 20]  Train Loss:0.174167  Train Acc:93.99% Test Loss:0.297684  Test Acc:90.17%  Learning Rate:0.010000	Time 03:22
Epoch [ 16/ 20]  Train Loss:0.159896  Train Acc:94.58% Test Loss:0.299201  Test Acc:89.86%  Learning Rate:0.001000	Time 04:30
Epoch [ 17/ 20]  Train Loss:0.158322  Train Acc:94.60% Test Loss:0.308903  Test Acc:90.05%  Learning Rate:0.001000	Time 06:31
Epoch [ 18/ 20]  Train Loss:0.152777  Train Acc:94.76% Test Loss:0.301876  Test Acc:89.98%  Learning Rate:0.001000	Time 03:08
Epoch [ 19/ 20]  Train Loss:0.152887  Train Acc:94.78% Test Loss:0.308110  Test Acc:89.77%  Learning Rate:0.001000	Time 03:11
Epoch [ 20/ 20]  Train Loss:0.150318  Train Acc:94.95% Test Loss:0.301545  Test Acc:90.06%  Learning Rate:0.001000	Time 03:06

接著可以分別列印，損失函式曲線，準確率曲線和學習率曲線

plot_history(epoch ,Acc, Loss, Lr)

損失函式曲線

在這里插入圖片描述

準確率曲線

在這里插入圖片描述

學習率曲線

在這里插入圖片描述

7.測驗

查看準確率

correct = 0   # 定義預測正確的圖片數，初始化為0
total = 0     # 總共參與測驗的圖片數，也初始化為0
# testloader = torch.utils.data.DataLoader(testset, batch_size=32,shuffle=True, num_workers=2)
for data in testloader:  # 回圈每一個batch
    images, labels = data
    images = images.to(device)
    labels = labels.to(device)
    net.eval()  # 把模型轉為test模式
    if hasattr(torch.cuda, 'empty_cache'):
        torch.cuda.empty_cache()
    outputs = net(images)  # 輸入網路進行測驗
    
    # outputs.data是一個4x10張量，將每一行的最大的那一列的值和序號各自組成一個一維張量回傳，第一個是值的張量，第二個是序號的張量，
    _, predicted = torch.max(outputs.data, 1)
    total += labels.size(0)          # 更新測驗圖片的數量
    correct += (predicted == labels).sum() # 更新正確分類的圖片的數量

print('Accuracy of the network on the 10000 test images: %.2f %%' % (100 * correct / total))

Accuracy of the network on the 10000 test images: 89.94 %

可以看到自定義網路的模型在測驗集中準確率達到89.94%

程式中的 torch.max(outputs.data, 1) ，回傳一個tuple (元組)

而這里很明顯，這個回傳的元組的第一個元素是image data，即是最大的值，第二個元素是label，即是最大的值的索引！我們只需要label（最大值的索引），所以就會有_,predicted這樣的賦值陳述句，表示忽略第一個回傳值，把它賦值給_，就是舍棄它的意思；

查看每一類的準確率

 # 定義2個存盤每類中測驗正確的個數的 串列，初始化為0
class_correct = list(0. for i in range(10))
class_total = list(0. for i in range(10))
# testloader = torch.utils.data.DataLoader(testset, batch_size=64,shuffle=True, num_workers=2)
net.eval()
with torch.no_grad():
    for data in testloader:
        images, labels = data
        images = images.to(device)
        labels = labels.to(device)
        if hasattr(torch.cuda, 'empty_cache'):
            torch.cuda.empty_cache()
        outputs = net(images)

        _, predicted = torch.max(outputs.data, 1)
    #4組(batch_size)資料中，輸出于label相同的，標記為1，否則為0
        c = (predicted == labels).squeeze()
        for i in range(len(images)):      # 因為每個batch都有4張圖片，所以還需要一個4的小回圈
            label = labels[i]   # 對各個類的進行各自累加
            class_correct[label] += c[i]
            class_total[label] += 1
 
 
for i in range(10):
    print('Accuracy of %5s : %.2f %%' % (classes[i], 100 * class_correct[i] / class_total[i]))

Accuracy of airplane : 92.30 %
Accuracy of automobile : 96.40 %
Accuracy of  bird : 84.90 %
Accuracy of   cat : 78.80 %
Accuracy of  deer : 91.20 %
Accuracy of   dog : 83.20 %
Accuracy of  frog : 93.30 %
Accuracy of horse : 92.30 %
Accuracy of  ship : 94.60 %
Accuracy of truck : 92.70 %

抽樣測驗并可視化一部分結果

dataiter = iter(testloader)
images, labels = dataiter.next()
images_ = images
#images_ = images_.view(images.shape[0], -1)
images_ = images_.to(device)
labels = labels.to(device)
val_output = net(images_)
_, val_preds = torch.max(val_output, 1)

fig = plt.figure(figsize=(25,4))

correct = torch.sum(val_preds == labels.data).item()

val_preds = val_preds.cpu()
labels = labels.cpu()

print("Accuracy Rate = {}%".format(correct/len(images) * 100))

fig = plt.figure(figsize=(25,25))
for idx in np.arange(64):    
    ax = fig.add_subplot(8, 8, idx+1, xticks=[], yticks=[])
    #fig.tight_layout()
#     plt.imshow(im_convert(images[idx]))
    imshow(images[idx])
    ax.set_title("{}, ({})".format(classes[val_preds[idx].item()], classes[labels[idx].item()]), 
                 color = ("green" if val_preds[idx].item()==labels[idx].item() else "red"))

Accuracy Rate = 87.5%
<Figure size 1800x288 with 0 Axes>

在這里插入圖片描述

8. 保存模型

torch.save(net,save_path[:-4]+'_'+str(epoch)+'.pth')
# torch.save(net, './model/MyNet.pth')

9. 預測

讀取本地圖片進行預測

import torch
from PIL import Image
from torch.autograd import Variable
import torch.nn.functional as F
from torchvision import datasets, transforms
import numpy as np
 
classes = ('plane', 'car', 'bird', 'cat',
           'deer', 'dog', 'frog', 'horse', 'ship', 'truck')

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

model = densenet_cifar()

model = torch.load(save_path)  # 加載模型
# model = model.to('cuda')
model.eval()  # 把模型轉為test模式

# 讀取要預測的圖片
img = Image.open("./airplane.jpg").convert('RGB') # 讀取影像

img

在這里插入圖片描述

接著我們就進行預測圖片，不過這里有一個點，我們需要對我們的圖片也進行transforms，因為我們的訓練的時候，對每個影像也是進行了transforms的，所以我們需要保持一致

trans = transforms.Compose([transforms.Scale((32,32)),
                            transforms.ToTensor(),
                            transforms.Normalize(mean=(0.5, 0.5, 0.5), 
                                                 std=(0.5, 0.5, 0.5)),
                           ])
 
img = trans(img)
img = img.to(device)
# 圖片擴展多一維,因為輸入到保存的模型中是4維的[batch_size,通道,長，寬]，而普通圖片只有三維，[通道,長，寬]
img = img.unsqueeze(0)  
    # 擴展后，為[1，3，32，32]
output = model(img)
prob = F.softmax(output,dim=1) #prob是10個分類的概率
print("概率",prob)
value, predicted = torch.max(output.data, 1)
print("類別",predicted.item())
print(value)
pred_class = classes[predicted.item()]
print("分類",pred_class)

概率 tensor([[1.0000e+00, 1.3627e-09, 3.7352e-06, 1.2643e-09, 3.4940e-07, 2.3562e-10,
         6.5075e-11, 2.9102e-10, 1.2497e-07, 1.4897e-09]], device='cuda:0',
       grad_fn=<SoftmaxBackward>)
類別 0
tensor([17.2041], device='cuda:0')
分類 plane

這里就可以看到，我們最后的結果，分類為plane，我們的置信率大概接近于100%了，對這個圖片的預測還是很準的

讀取圖片地址進行預測

我們也可以通過讀取圖片的url地址進行預測，這里我找了多個不同的圖片進行預測

import requests
from PIL import Image
url = 'https://dss2.bdstatic.com/70cFvnSh_Q1YnxGkpoWK1HF6hhy/it/u=947072664,3925280208&fm=26&gp=0.jpg'
url = 'https://ss0.bdstatic.com/70cFuHSh_Q1YnxGkpoWK1HF6hhy/it/u=2952045457,215279295&fm=26&gp=0.jpg'
url = 'https://ss0.bdstatic.com/70cFvHSh_Q1YnxGkpoWK1HF6hhy/it/u=2838383012,1815030248&fm=26&gp=0.jpg'
url = 'https://gimg2.baidu.com/image_search/src=http%3A%2F%2Fwww.goupuzi.com%2Fnewatt%2FMon_1809%2F1_179223_7463b117c8a2c76.jpg&refer=http%3A%2F%2Fwww.goupuzi.com&app=2002&size=f9999,10000&q=a80&n=0&g=0n&fmt=jpeg?sec=1624346733&t=36ba18326a1e010737f530976201326d'
url = 'https://ss3.bdstatic.com/70cFv8Sh_Q1YnxGkpoWK1HF6hhy/it/u=2799543344,3604342295&fm=224&gp=0.jpg'
# url = 'https://ss1.bdstatic.com/70cFuXSh_Q1YnxGkpoWK1HF6hhy/it/u=2032505694,2851387785&fm=26&gp=0.jpg'
response = requests.get(url, stream=True)
print (response)
img = Image.open(response.raw)
img

在這里插入圖片描述

這里和前面是一樣的

trans = transforms.Compose([transforms.Scale((32,32)),
                            transforms.ToTensor(),
                            transforms.Normalize(mean=(0.5, 0.5, 0.5), 
                                                 std=(0.5, 0.5, 0.5)),
                           ])
 
img = trans(img)
img = img.to(device)
# 圖片擴展多一維,因為輸入到保存的模型中是4維的[batch_size,通道,長，寬]，而普通圖片只有三維，[通道,長，寬]
img = img.unsqueeze(0)  
    # 擴展后，為[1，3，32，32]
output = model(img)
prob = F.softmax(output,dim=1) #prob是10個分類的概率
print("概率",prob)
value, predicted = torch.max(output.data, 1)
print("類別",predicted.item())
print(value)
pred_class = classes[predicted.item()]
print("分類",pred_class)

概率 tensor([[7.5937e-02, 5.5344e-06, 4.2487e-03, 9.0580e-01, 6.9736e-04, 1.2475e-02,
         9.0640e-05, 6.7607e-04, 7.5732e-06, 5.8428e-05]], device='cuda:0',
       grad_fn=<SoftmaxBackward>)
類別 3
tensor([6.8681], device='cuda:0')
分類 cat

我們的分類選擇了cat，置信率大約是90.5%，也是比較高的，還是很不錯的，

10.總結

DenseNet的結構有如下三個特性：

神經網路一般需要使用池化等操作縮小特征圖尺寸來提取語意特征，而Dense Block需要保持每一個Block內的特征圖尺寸一致來直接進行Concatnate操作，因此DenseNet被分成了多個Block，Block的數量一般為4，
兩個相鄰的Dense Block之間的部分被稱為Transition層，對于Transition層，它主要是連接兩個相鄰的DenseBlock，并且降低特征圖大小，具體包括BN、ReLU、1×1卷積（Conv）、2×2平均池化操作，1×1卷積的作用是降維，起到壓縮模型的作用，而平均池化則是降低特征圖的尺寸，
Transition層可以起到壓縮模型的作用，假定Transition的上接DenseBlock得到的特征圖channels數為m ，Transition層可以產生 θ m θm θm個特征（通過卷積層），其中 0 < θ ≤ 1 0 <θ ≤1 0<θ≤1是壓縮系數（compression rate），當 θ = 1 θ=1 θ=1時，特征個數經過Transition層沒有變化，即無壓縮，而當壓縮系數小于1時，這種結構稱為DenseNet-C，原論文中使用 θ ≤ 0.5 θ≤0.5 θ≤0.5 ，對于使用bottleneck層的DenseBlock結構和壓縮系數小于1的Transition組合結構稱為DenseNet-BC，

總的來說，這個DenseNet展現除了非常不錯的影像分類的性能，并且在能超過ResNet，是計算機視覺的又一突破，但是我們影像分類中還是常會使用ResNet

順帶提一句，我們的資料和代碼都在我的匯總篇里有說明，如果需要，可以自取

這里再貼一下匯總篇：匯總篇

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/293509.html

標籤：AI

上一篇：Pytorch基礎(機器學習)

下一篇：Value-Based Reinforcement Learning-DQN