文章目錄
- 深度卷積生成對抗網路(DCGAN)
- 一、前言
- 二、什么是生成對抗網路?
- 1. 設定GPU
- 2. 加載和準備資料集
- 三、創建模型
- 1. 生成器
- 2. 判別器
- 四、定義損失函式和優化器
- 1. 判別器損失
- 2. 生成器損失
- 五、定義訓練回圈
- 六、訓練模型
- 七、創建 GIF
- 八、同系列作品
深度卷積生成對抗網路(DCGAN)
一、前言
🚀 我的環境:
- 語言環境:Python3.6.5
- 編譯器:jupyter notebook
- 深度學習環境:TensorFlow2.4.1
🚀 深度學習新人必看:
- 小白入門深度學習 | 第一篇:配置深度學習環境
- 小白入門深度學習 | 第二篇:編譯器的使用-Jupyter Notebook
- 小白入門深度學習 | 第三篇:深度學習初體驗
🚀 卷積神經網路篇:
- 深度學習100例-卷積神經網路(CNN)實作mnist手寫數字識別 | 第1天
- 深度學習100例-卷積神經網路(CNN)彩色圖片分類 | 第2天
- 深度學習100例-卷積神經網路(CNN)服裝影像分類 | 第3天
- 深度學習100例-卷積神經網路(CNN)花朵識別 | 第4天
- 深度學習100例-卷積神經網路(CNN)天氣識別 | 第5天
- 深度學習100例-卷積神經網路(VGG-16)識別海賊王草帽一伙 | 第6天
- 深度學習100例-卷積神經網路(VGG-19)識別靈籠中的人物 | 第7天
- 深度學習100例-卷積神經網路(ResNet-50)鳥類識別 | 第8天
- 深度學習100例-卷積神經網路(AlexNet)手把手教學 | 第11天
- 深度學習100例-卷積神經網路(CNN)識別驗證碼 | 第12天
- 深度學習100例-卷積神經網路(Inception V3)識別手語 | 第13天
- 深度學習100例-卷積神經網路(Inception-ResNet-v2)識別交通標志 | 第14天
- 深度學習100例-卷積神經網路(CNN)實作車牌識別 | 第15天
- 深度學習100例-卷積神經網路(CNN)識別神奇寶貝小智一伙 | 第16天
- 深度學習100例-卷積神經網路(CNN)識別眼睛狀態 | 第17天
🚀 回圈神經網路篇:
- 深度學習100例-回圈神經網路(RNN)實作股票預測 | 第9天
- 深度學習100例-回圈神經網路(LSTM)實作股票預測 | 第10天
🚀 生成對抗網路篇:
- 深度學習100例-生成對抗網路(GAN)手寫數字生成 | 第18天
🚀 本文選自專欄:《深度學習基礎50例》
🚀 精選優質專欄:《夜深人靜寫演算法》
二、什么是生成對抗網路?
生成對抗網路(GAN)是當今計算機科學領域最有趣的想法之一,兩個模型通過對抗程序同時訓練,一個生成器模型(“藝術家”)學習創造看起來真實的影像,而判別器模型(“藝術評論家”)學習區分真偽影像,

GAN 的應用十分廣泛,它的應用包括影像合成、風格遷移、照片修復以及照片編輯,資料增強等等,
1)風格遷移
影像風格遷移是將影像A的風格轉換到影像B中去,得到新的影像,

2)影像生成
GAN 不但能生成人臉,還能生成其他型別的圖片,比如漫畫人物,

1. 設定GPU
import tensorflow as tf
gpus = tf.config.list_physical_devices("GPU")
if gpus:
tf.config.experimental.set_memory_growth(gpus[0], True) #設定GPU顯存用量按需使用
tf.config.set_visible_devices([gpus[0]],"GPU")
# 列印顯卡資訊,確認GPU可用
print(gpus)
[PhysicalDevice(name='/physical_device:GPU:0', device_type='GPU')]
from tensorflow.keras import layers
from IPython import display
import matplotlib.pyplot as plt
import numpy as np
import glob,imageio,os,PIL,time
2. 加載和準備資料集
您將使用 MNIST 資料集來訓練生成器和判別器,生成器將生成類似于 MNIST 資料集的手寫數字,
(train_images, _), (_, _) = tf.keras.datasets.mnist.load_data()
train_images = train_images.reshape(train_images.shape[0], 28, 28, 1).astype('float32')
# 將圖片標準化到 [-1, 1] 區間內
train_images = train_images / 127.5 - 1
BUFFER_SIZE = 60000
BATCH_SIZE = 256
# 批量化和打亂資料
train_dataset = tf.data.Dataset.from_tensor_slices(train_images).shuffle(BUFFER_SIZE).batch(BATCH_SIZE)
三、創建模型
1. 生成器
生成器使用 tf.keras.layers.Conv2DTranspose (上采樣)層來從種子(隨機噪聲)中產生圖片,以一個使用該種子作為輸入的 Dense 層開始,然后多次上采樣直到達到所期望的 28x28x1 的圖片尺寸,注意除了輸出層使用 tanh 之外,其他每層均使用 tf.keras.layers.LeakyReLU 作為激活函式,
def make_generator_model():
model = tf.keras.Sequential([
layers.Dense(7*7*256, use_bias=False, input_shape=(100,)),
layers.BatchNormalization(),
layers.LeakyReLU(),
layers.Reshape((7, 7, 256)),
layers.Conv2DTranspose(128, (5, 5), strides=(1, 1), padding='same', use_bias=False),
layers.BatchNormalization(),
layers.LeakyReLU(),
layers.Conv2DTranspose(64, (5, 5), strides=(2, 2), padding='same', use_bias=False),
layers.BatchNormalization(),
layers.LeakyReLU(),
layers.Conv2DTranspose(1, (5, 5), strides=(2, 2), padding='same', use_bias=False, activation='tanh')
])
return model
generator = make_generator_model()
generator.summary()
Model: "sequential"
_________________________________________________________________
Layer (type) Output Shape Param #
=================================================================
dense (Dense) (None, 12544) 1254400
_________________________________________________________________
batch_normalization (BatchNo (None, 12544) 50176
_________________________________________________________________
leaky_re_lu (LeakyReLU) (None, 12544) 0
_________________________________________________________________
reshape (Reshape) (None, 7, 7, 256) 0
_________________________________________________________________
conv2d_transpose (Conv2DTran (None, 7, 7, 128) 819200
_________________________________________________________________
batch_normalization_1 (Batch (None, 7, 7, 128) 512
_________________________________________________________________
leaky_re_lu_1 (LeakyReLU) (None, 7, 7, 128) 0
_________________________________________________________________
conv2d_transpose_1 (Conv2DTr (None, 14, 14, 64) 204800
_________________________________________________________________
batch_normalization_2 (Batch (None, 14, 14, 64) 256
_________________________________________________________________
leaky_re_lu_2 (LeakyReLU) (None, 14, 14, 64) 0
_________________________________________________________________
conv2d_transpose_2 (Conv2DTr (None, 28, 28, 1) 1600
=================================================================
Total params: 2,330,944
Trainable params: 2,305,472
Non-trainable params: 25,472
_________________________________________________________________
2. 判別器
判別器是一個基于 CNN 的圖片分類器,
def make_discriminator_model():
model = tf.keras.Sequential([
layers.Conv2D(64, (5, 5), strides=(2, 2), padding='same', input_shape=[28, 28, 1]),
layers.LeakyReLU(),
layers.Dropout(0.3),
layers.Conv2D(128, (5, 5), strides=(2, 2), padding='same'),
layers.LeakyReLU(),
layers.Dropout(0.3),
layers.Flatten(),
layers.Dense(1)
])
return model
discriminator = make_discriminator_model()
discriminator.summary()
Model: "sequential_1"
_________________________________________________________________
Layer (type) Output Shape Param #
=================================================================
conv2d (Conv2D) (None, 14, 14, 64) 1664
_________________________________________________________________
leaky_re_lu_3 (LeakyReLU) (None, 14, 14, 64) 0
_________________________________________________________________
dropout (Dropout) (None, 14, 14, 64) 0
_________________________________________________________________
conv2d_1 (Conv2D) (None, 7, 7, 128) 204928
_________________________________________________________________
leaky_re_lu_4 (LeakyReLU) (None, 7, 7, 128) 0
_________________________________________________________________
dropout_1 (Dropout) (None, 7, 7, 128) 0
_________________________________________________________________
flatten (Flatten) (None, 6272) 0
_________________________________________________________________
dense_1 (Dense) (None, 1) 6273
=================================================================
Total params: 212,865
Trainable params: 212,865
Non-trainable params: 0
_________________________________________________________________
四、定義損失函式和優化器
為兩個模型定義損失函式和優化器,
# 該方法回傳計算交叉熵損失的輔助函式
cross_entropy = tf.keras.losses.BinaryCrossentropy(from_logits=True)
1. 判別器損失
該方法量化判斷真偽圖片的能力,它將判別器對真實圖片的預測值與值全為 1 的陣列進行對比,將判別器對偽造(生成的)圖片的預測值與值全為 0 的陣列進行對比,
def discriminator_loss(real_output, fake_output):
real_loss = cross_entropy(tf.ones_like(real_output), real_output)
fake_loss = cross_entropy(tf.zeros_like(fake_output), fake_output)
total_loss = real_loss + fake_loss
return total_loss
2. 生成器損失
生成器損失量化其欺騙判別器的能力,直觀來講,如果生成器表現良好,判別器將會把偽造圖片判斷為真實圖片(或 1),這里我們將把判別器在生成圖片上的判斷結果與一個值全為 1 的陣列進行對比,
def generator_loss(fake_output):
return cross_entropy(tf.ones_like(fake_output), fake_output)
由于我們需要分別訓練兩個網路,判別器和生成器的優化器是不同的,
generator_optimizer = tf.keras.optimizers.Adam(1e-4)
discriminator_optimizer = tf.keras.optimizers.Adam(1e-4)
五、定義訓練回圈
EPOCHS = 60
noise_dim = 100
num_examples_to_generate = 16
# 我們將重復使用該種子(在 GIF 中更容易可視化進度)
seed = tf.random.normal([num_examples_to_generate, noise_dim])
訓練回圈在生成器接收到一個隨機種子作為輸入時開始,該種子用于生產一張圖片,判別器隨后被用于區分真實圖片(選自訓練集)和偽造圖片(由生成器生成),針對這里的每一個模型都計算損失函式,并且計算梯度用于更新生成器與判別器,
# 注意 `tf.function` 的使用
# 該注解使函式被“編譯”
@tf.function
def train_step(images):
# 生成噪音
noise = tf.random.normal([BATCH_SIZE, noise_dim])
with tf.GradientTape() as gen_tape, tf.GradientTape() as disc_tape:
generated_images = generator(noise, training=True)
real_output = discriminator(images, training=True)
fake_output = discriminator(generated_images, training=True)
# 計算loss
gen_loss = generator_loss(fake_output)
disc_loss = discriminator_loss(real_output, fake_output)
#計算梯度
gradients_of_generator = gen_tape.gradient(gen_loss, generator.trainable_variables)
gradients_of_discriminator = disc_tape.gradient(disc_loss, discriminator.trainable_variables)
#更新模型
generator_optimizer.apply_gradients(zip(gradients_of_generator, generator.trainable_variables))
discriminator_optimizer.apply_gradients(zip(gradients_of_discriminator, discriminator.trainable_variables))
def train(dataset, epochs):
for epoch in range(epochs):
start = time.time()
for image_batch in dataset:
train_step(image_batch)
# 實時更新生成的圖片
display.clear_output(wait=True)
generate_and_save_images(generator, epoch + 1, seed)
print ('Time for epoch {} is {} sec'.format(epoch + 1, time.time()-start))
# 最后一個 epoch 結束后生成圖片
display.clear_output(wait=True)
generate_and_save_images(generator, epochs, seed)
生成與保存圖片
def generate_and_save_images(model, epoch, test_input):
# 注意 training` 設定為 False
# 因此,所有層都在推理模式下運行(batchnorm),
predictions = model(test_input, training=False)
fig = plt.figure(figsize=(4,4))
for i in range(predictions.shape[0]):
plt.subplot(4, 4, i+1)
plt.imshow(predictions[i, :, :, 0] * 127.5 + 127.5, cmap='gray')
plt.axis('off')
plt.savefig('./images/19/image_at_epoch_{:04d}.png'.format(epoch))
plt.show()
六、訓練模型
呼叫上面定義的 train() 方法來同時訓練生成器和判別器,在訓練之初,生成的圖片看起來像是隨機噪聲,隨著訓練程序的進行,生成的數字將越來越真實,在大概 50 個 epoch 之后,這些圖片看起來像是 MNIST 數字,
%%time:將會給出cell的代碼運行一次所花費的時間,
%%time
train(train_dataset, EPOCHS)

Wall time: 4min 46s
七、創建 GIF
import imageio,pathlib
def compose_gif():
# 圖片地址
data_dir = "./images/19"
data_dir = pathlib.Path(data_dir)
paths = list(data_dir.glob('*'))
gif_images = []
for path in paths:
gif_images.append(imageio.imread(path))
imageio.mimsave("./pic_gif/MINST_DCGAN_19.gif",gif_images,fps=8)
compose_gif()
print("GIF動圖生成完成!")
GIF動圖生成完成!

八、同系列作品
🚀 深度學習新人必看:
- 小白入門深度學習 | 第一篇:配置深度學習環境
- 小白入門深度學習 | 第二篇:編譯器的使用-Jupyter Notebook
- 小白入門深度學習 | 第三篇:深度學習初體驗
🚀 卷積神經網路篇:
- 深度學習100例-卷積神經網路(CNN)實作mnist手寫數字識別 | 第1天
- 深度學習100例-卷積神經網路(CNN)彩色圖片分類 | 第2天
- 深度學習100例-卷積神經網路(CNN)服裝影像分類 | 第3天
- 深度學習100例-卷積神經網路(CNN)花朵識別 | 第4天
- 深度學習100例-卷積神經網路(CNN)天氣識別 | 第5天
- 深度學習100例-卷積神經網路(VGG-16)識別海賊王草帽一伙 | 第6天
- 深度學習100例-卷積神經網路(VGG-19)識別靈籠中的人物 | 第7天
- 深度學習100例-卷積神經網路(ResNet-50)鳥類識別 | 第8天
- 深度學習100例-卷積神經網路(AlexNet)手把手教學 | 第11天
- 深度學習100例-卷積神經網路(CNN)識別驗證碼 | 第12天
- 深度學習100例-卷積神經網路(Inception V3)識別手語 | 第13天
- 深度學習100例-卷積神經網路(Inception-ResNet-v2)識別交通標志 | 第14天
- 深度學習100例-卷積神經網路(CNN)實作車牌識別 | 第15天
- 深度學習100例-卷積神經網路(CNN)識別神奇寶貝小智一伙 | 第16天
- 深度學習100例-卷積神經網路(CNN)注意力檢測 | 第17天
🚀 回圈神經網路篇:
- 深度學習100例-回圈神經網路(RNN)實作股票預測 | 第9天
- 深度學習100例-回圈神經網路(LSTM)實作股票預測 | 第10天
🚀 生成對抗網路篇:
- 深度學習100例-生成對抗網路(GAN)手寫數字生成 | 第18天
🚀 本文選自專欄:《深度學習100例》
未完~
持續更新 歡迎 點贊👍、收藏?、關注👀
- 點贊👍:點贊給我持續更新的動力
- 收藏??:收藏后你能夠隨時找到文章
- 關注👀:關注我第一時間接收最新文章
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/290567.html
標籤:AI
上一篇:SVD奇異值分解簡述
