必做題：

（1）把模型改為 resnet18，加載相應的模型權重（Lesson2 的物料包中有），跑一下 0.jpg和 1.jpg，看一下輸出結果，官方 torchvision 訓練 mobilenet 和訓練 resnet 的方式是一樣的，所以資料預處理和資料后處理部分完全相同，

('umbrella', 0.2279825508594513)
('peacock', 0.9976727366447449)

（2）自己找 2 張其他圖，用 resnet18 做下推理，

在這里插入圖片描述

翻車了

('kite', 0.3684402108192444) # bald-eagle.jpg
('quill', 0.013711282052099705) # hen.jpg

思考題：

（1）以 ResNet18 為例，用 time 模塊和 for 回圈，對”./images/0.jpg”連續推理 100次，統計時間開銷，比如：

# 有 CUDA 的，改下代碼：self.device=torch.device('cuda')，用上述相同方法測驗時間開銷，
model_classify=ModelPipline()
import time
image=cv2.imread("./images/0.jpg")
t_all=0
for i in range(100):
	t_start=time.time()
	result=model_classify.predict(image)
	t_end=time.time()
	t_all+=t_end-t_start
print(t_all)

測驗結果

('kite', 0.3684402108192444)
4.733127117156982

（2）在資料預處理和資料后處理的代碼實作中，到處在用 numpy, opencv, torch 對陣列做相應變換，大家至少要把課程中出現的函式們給理解，

作業原始碼

import torch
import torchvision.models as models
import numpy as np
import cv2
import time


class ModelPipline(object):
    def __init__(self):
        # 進入模型的圖片大小：為資料預處理和后處理做準備
        self.inputs_size = (224, 224)
        # CPU or CUDA：為資料預處理和模型加載做準備
        self.device = torch.device('cuda')
        # 載入模型結構和模型權重
        self.model = self.get_model()
        # 載入標簽，為資料后處理做準備
        label_names = open('./labels/imagenet_label.txt', 'r').readlines()
        self.label_names = [line.strip('\n') for line in label_names]

    def predict(self, image):
        # 資料預處理
        inputs = self.preprocess(image)
        # 資料進網路
        outputs = self.model(inputs)
        # 資料后處理
        results = self.postprocess(outputs)
        return results

    def get_model(self):
        # 上一節課的內容
        model = models.resnet18()
        pretrained_state_dict = torch.load('./weights/resnet18-5c106cde.pth',
                                           map_location=lambda storage, loc: storage)
        model.load_state_dict(pretrained_state_dict, strict=True)
        model.to(self.device)
        model.eval()
        return model

    def preprocess(self, image):
        # opencv默認讀入是BGR，需要轉為RGB，和訓練時保持一致
        image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
        # resize成模型輸入的大小，和訓練時保持一致        image = cv2.resize(image, dsize=self.inputs_size)
        # 歸一化和標準化，和訓練時保持一致
        inputs = image / 255
        inputs = (inputs - np.array([0.485, 0.456, 0.406])) / np.array([0.229, 0.224, 0.225])
        ##以下是影像任務的通用處理
        # (H,W,C) ——> (C,H,W)
        inputs = inputs.transpose(2, 0, 1)
        # (C,H,W) ——> (1,C,H,W)
        inputs = inputs[np.newaxis, :, :, :]
        # NumpyArray ——> Tensor
        inputs = torch.from_numpy(inputs)
        # dtype float32
        inputs = inputs.type(torch.float32)
        # 與self.model放在相同硬體上
        inputs = inputs.to(self.device)
        return inputs

    def postprocess(self, outputs):
        # 取softmax得到每個類別的置信度
        outputs = torch.softmax(outputs, dim=1)
        # 取最高置信度的類別和分數
        score, label_id = torch.max(outputs, dim=1)
        # Tensor ——> float
        score, label_id = score.item(), label_id.item()
        # 查找標簽名稱
        label_name = self.label_names[label_id]
        return label_name, score


if __name__ == '__main__':
    model_classify = ModelPipline()

    t_all = 0
    image = cv2.imread('./images/bald-eagle.jpg')
    for i in range(100):
        t_start = time.time()
        result = model_classify.predict(image)
        t_end = time.time()
        t_all += (t_end - t_start)
    print(result)
    print(t_all)

    # image = cv2.imread('./images/hen.jpg')
    # result = model_classify.predict(image)
    # print(result)

打卡說明

答題格式：
必做題：
題（1）提交下推理的輸出結果（標簽和置信度），
題（2）提交下找的 2 張圖片，以及推理的輸出結果，
思考題：
題（1）CPU 推理和 CUDA 推理，各自的時間開銷，
題（2）無

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/321480.html

標籤：其他

上一篇：[人工智能-深度學習-27]：卷積神經網路CNN - 核心概念（卷積、滑動、填充、引數共享、通道）

下一篇：用python做一個隨機點名程式（不重復點名）

PyTorch學習Lesson3

必做題：

（1） 把模型改為 resnet18，加載相應的模型權重（Lesson2 的物料包中有），跑一下 0.jpg和 1.jpg，看一下輸出結果，官方 torchvision 訓練 mobilenet 和訓練 resnet 的方式是一樣的，所以資料預處理和資料后處理部分完全相同，

（2） 自己找 2 張其他圖，用 resnet18 做下推理，

思考題：

（1） 以 ResNet18 為例，用 time 模塊和 for 回圈，對”./images/0.jpg”連續推理 100次，統計時間開銷，比如：

（2） 在資料預處理和資料后處理的代碼實作中，到處在用 numpy, opencv, torch 對陣列做相應變換，大家至少要把課程中出現的函式們給理解，

作業原始碼

打卡說明

（1）把模型改為 resnet18，加載相應的模型權重（Lesson2 的物料包中有），跑一下 0.jpg和 1.jpg，看一下輸出結果，官方 torchvision 訓練 mobilenet 和訓練 resnet 的方式是一樣的，所以資料預處理和資料后處理部分完全相同，

（2）自己找 2 張其他圖，用 resnet18 做下推理，

（1）以 ResNet18 為例，用 time 模塊和 for 回圈，對”./images/0.jpg”連續推理 100次，統計時間開銷，比如：

（2）在資料預處理和資料后處理的代碼實作中，到處在用 numpy, opencv, torch 對陣列做相應變換，大家至少要把課程中出現的函式們給理解，