主頁 >  其他 > 深度神經網路中的卷積

深度神經網路中的卷積

2021-08-13 06:28:40 其他

文章目錄

  • 卷積單元
    • 經典卷積運算
      • 經典二維卷積
      • 經典膨脹二維卷積運算
      • 經典二維轉置卷積運算
  • 實驗分析
    • 實驗說明
    • 實驗結果
  • 參考文獻

卷積單元

本文給出了四維張量卷積的運算式,卷積輸出大小的運算式,以及Matlab和PyTorch下卷積實體,

直觀地理解卷積

經典卷積運算

經典二維卷積

設有 N i N_i Ni? 個二維卷積輸入 I ∈ R N i × C i × H i × W i {\bm I} \in {\mathbb R}^{N_i × C_i \times H_i \times W_i} IRNi?×Ci?×Hi?×Wi?, C k × C i C_k \times C_i Ck?×Ci? 個二維卷積核 K ∈ R C k × C i × H k × W k {\bm K} \in {\mathbb R}^{C_k \times C_i \times H_k \times W_k} KRCk?×Ci?×Hk?×Wk?, N o N_o No? 個卷積輸出記為 O ∈ R N o × C o × H o × W o {\bm O} \in {\mathbb R}^{N_o × C_o \times H_o \times W_o} ORNo?×Co?×Ho?×Wo?, 在經典卷積神經網路中, 有 C k = C o , N o = N i C_k = C_o, N_o = N_i Ck?=Co?,No?=Ni?, K {\bm K} K I \bm I I 間的二維卷積運算可以表示為

O n o , c o , : , : = ∑ c i = 0 C i ? 1 I n o , c i , : , : ? K c o , c i , : , : = ∑ c i = 0 C i ? 1 Z n o , c o , c i , : , : \begin{aligned} {\bm O}_{n_o, c_o, :, :} &= \sum_{c_i=0}^{C_i-1} {\bm I}_{n_o, c_i, :,:} * {\bm K}_{c_o, c_i, :,:} \\ &= \sum_{c_i=0}^{C_i-1}{\bm Z}_{n_o, c_o, c_i, :, :} \end{aligned} Ono?,co?,:,:??=ci?=0Ci??1?Ino?,ci?,:,:??Kco?,ci?,:,:?=ci?=0Ci??1?Zno?,co?,ci?,:,:??
其中, ? * ? 表示經典二維卷積運算, 卷積核 K c o , c i , : , : {\bm K}_{c_o, c_i, :,:} Kco?,ci?,:,:? 與輸入 I n o , c i , : , : {\bm I}_{n_o, c_i, :,:} Ino?,ci?,:,:? 的卷積結果記為 Z n o , c o , c i , : , : ∈ R H o × W o {\bm Z}_{n_o, c_o, c_i, :, :}\in {\mathbb R}^{H_o \times W_o} Zno?,co?,ci?,:,:?RHo?×Wo?, 則

Z n o , c o , c i , h o , w o = ∑ h = 0 H k ? 1 ∑ w = 0 W k ? 1 I n o , c i , h o + h ? 1 , w o + w ? 1 ? K c o , c i , h , w . {\bm Z}_{n_o, c_o, c_i, h_o, w_o} = \sum_{h=0}^{H_k-1}\sum_{w=0}^{W_k-1} {\bm I}_{n_o, c_i, h_o + h - 1, w_o + w - 1} \cdot {\bm K}_{c_o, c_i, h, w}. Zno?,co?,ci?,ho?,wo??=h=0Hk??1?w=0Wk??1?Ino?,ci?,ho?+h?1,wo?+w?1??Kco?,ci?,h,w?.

記卷積程序中, 高度與寬度維上填補(padding)大小為 H p × W p H_p \times W_p Hp?×Wp?, 卷積步長為 H s × W s H_s \times W_s Hs?×Ws?, 則卷積輸出大小滿足

H o = ? H i + 2 × H p ? H k H s + 1 ? W o = ? W i + 2 × W p ? W k W s + 1 ? \begin{array}{ll} H_{o} &= \left\lfloor\frac{H_{i} + 2 \times H_p - H_k}{H_s} + 1\right\rfloor \\ W_{o} &= \left\lfloor\frac{W_{i} + 2 \times W_p - W_k}{W_s} + 1\right\rfloor \end{array} Ho?Wo??=?Hs?Hi?+2×Hp??Hk??+1?=?Ws?Wi?+2×Wp??Wk??+1??

卷積神經網路中的卷積操作, 實際上是相關操作, 因為在運算程序中, 未對卷積核進行翻轉操作

下圖所示為二維卷積操作示意圖.

卷積示意圖

經典膨脹二維卷積運算

設有 N i N_i Ni? 個二維卷積輸入 I ∈ R N i × C i × H i × W i {\bm I} \in {\mathbb R}^{N_i × C_i \times H_i \times W_i} IRNi?×Ci?×Hi?×Wi?, C k × C i C_k \times C_i Ck?×Ci? 個二維卷積核 K ∈ R C k × C i × H k × W k {\bm K} \in {\mathbb R}^{C_k \times C_i \times H_k \times W_k} KRCk?×Ci?×Hk?×Wk?, 高度與寬度維上填補(padding)大小為 H p × W p H_p×W_p Hp?×Wp?, 膨脹(dilation)大小為 H d × W d H_d×W_d Hd?×Wd?, 卷積步長為 H s × W s H_s×W_s Hs?×Ws?, 在經典膨脹二維卷積神經網路中, 有 C k = C o , N o = N i C_k = C_o, N_o = N_i Ck?=Co?,No?=Ni?, 則卷積后的輸出為 O ∈ R N o × C o × H o × W o {\bm O} \in {\mathbb R}^{N_o × C_{o}\times H_{o} \times W_{o}} ORNo?×Co?×Ho?×Wo?, 其中

H o = ? H i + 2 × H p ? H d × ( H k ? 1 ) ? 1 H s + 1 ? W o = ? W i + 2 × W p ? W d × ( W k ? 1 ) ? 1 W s + 1 ? \begin{array}{ll} H_{o} &= \left\lfloor\frac{H_{i} + 2 \times H_p - H_d \times (H_k - 1) - 1}{H_s} + 1\right\rfloor \\ W_{o} &= \left\lfloor\frac{W_{i} + 2 \times W_p - W_d \times (W_k - 1) - 1}{W_s} + 1\right\rfloor \end{array} Ho?Wo??=?Hs?Hi?+2×Hp??Hd?×(Hk??1)?1?+1?=?Ws?Wi?+2×Wp??Wd?×(Wk??1)?1?+1??

可以發現當膨脹大小為 H d × W d = 1 × 1 H_d×W_d = 1×1 Hd?×Wd?=1×1 時, 膨脹卷積退化為經典卷積.

更多二維卷積示意圖參見 A technical report on convolution arithmetic in the context of deep learning.

經典二維轉置卷積運算

二維轉置卷積是一種解卷積方法, 設有二維卷積核 K ∈ R C o × H k × W k {\bm K} \in {\mathbb R}^{C_o\times H_k \times W_k} KRCo?×Hk?×Wk?, 二維卷積輸入 I ∈ R N i × C i × H i × W i {\bm I} \in {\mathbb R}^{N_i × C_{i}\times H_{i} \times W_{i}} IRNi?×Ci?×Hi?×Wi?, 高度與寬度維上填補(padding)大小為 H p × W p H_p×W_p Hp?×Wp?, 膨脹(dilation)大小為 H d × W d H_d×W_d Hd?×Wd?, 卷積步長為 H s × W s H_s×W_s Hs?×Ws?, 則卷積后填補(output-padding)大小為 H o p × W o p H_{op}×W_{op} Hop?×Wop?, 則卷積后的輸出為 Y ∈ R N × C o × H o × W o {\bm Y} \in {\mathbb R}^{N × C_{o}\times H_{o} \times W_{o}} YRN×Co?×Ho?×Wo?, 其中

H o = ( H i ? 1 ) × H s ? 2 × H p + H d × ( H k ? 1 ) + H o p + 1 W o = ( W i ? 1 ) × W s ? 2 × W p + W d × ( W k ? 1 ) + W o p + 1 \begin{array}{ll} H_{o} &= (H_{i} - 1) \times H_s - 2 \times H_p + H_d \times (H_k - 1) + H_{op} + 1 \\ W_{o} &= (W_{i} - 1) \times W_s - 2 \times W_p + W_d \times (W_k - 1) + W_{op} + 1 \end{array} Ho?Wo??=(Hi??1)×Hs??2×Hp?+Hd?×(Hk??1)+Hop?+1=(Wi??1)×Ws??2×Wp?+Wd?×(Wk??1)+Wop?+1?

實驗分析

實驗說明

以二維卷積為例, 設有矩陣 a , b {\bm a}, {\bm b} a,b

a = [ 1 2 3 4 5 6 7 8 9 ] {\bm a} = \left[ {\begin{array}{ccc} 1&2&3\\ 4&5&6\\ 7&8&9 \end{array}} \right] a=???147?258?369????

b = [ 1 2 3 4 ] {\bm b} = \left[ {\begin{array}{ccc} 1&2\\ 3&4 \end{array}} \right] b=[13?24?]

則有卷積 a ? b {\bm a}*{\bm b} a?b

a ? b = [ 1 4 7 6 7 23 33 24 19 53 63 42 21 52 59 36 ] {\bm a}*{\bm b} = \left[ {\begin{array}{cccc} 1&4&7&6\\ 7&{23}&{33}&{24}\\ {19}&{53}&{63}&{42}\\ {21}&{52}&{59}&{36} \end{array}} \right] a?b=?????171921?4235352?7336359?6244236??????

互相關 a ? b {\bm a}\star{\bm b} a?b

a ? b = [ 4 11 18 9 18 37 47 21 36 67 77 33 14 23 26 9 ] {\bm a}\star{\bm b} = \left[ {\begin{array}{cccc} 4&{11}&{18}&9\\ {18}&{37}&{47}&{21}\\ {36}&{67}&{77}&{33}\\ {14}&{23}&{26}&9 \end{array}} \right] a?b=?????4183614?11376723?18477726?921339??????

實驗結果

在 Matlab 環境中, 輸入如下代碼, 求解卷積 a ? b {\bm a} * {\bm b} a?b 與相關 a ? b {\bm a}\star{\bm b} a?b

   a = [1 2 3;4 5 6;7 8 9];
   b = [1 2;3 4];

   disp(a)
   disp(b)

   % convolution
   disp(conv2(a, b))

   % cross-correlation
   disp(xcorr2(a, b))

MATLAB中的2D卷積和相關結果為

     1     2     3
     4     5     6
     7     8     9

     1     2
     3     4

     1     4     7     6
     7    23    33    24
    19    53    63    42
    21    52    59    36

     4    11    18     9
    18    37    47    21
    36    67    77    33
    14    23    26     9

在 Python 環境中, 輸入如下代碼, 求解卷積 a ? b {\bm a} * {\bm b} a?b

   import torch as th

   a = th.tensor([[1., 2, 3], [4, 5, 6], [7, 8, 9]])
   b = th.tensor([[1., 2], [3, 4]])

   a = a.unsqueeze(0)  # 1x3x3
   a = a.unsqueeze(0)  # 1x1x3x3
   b = b.unsqueeze(0)  # 1x2x2
   b = b.unsqueeze(0)  # 1x1x2x2

   print(a, a.size())
   print(b, b.size())

   c = th.conv2d(a, b, stride=1, padding=1)

   print(c)

PyTorch中的2D卷積結果為

   tensor([[[[1., 2., 3.],
             [4., 5., 6.],
             [7., 8., 9.]]]]) torch.Size([1, 1, 3, 3])
   tensor([[[[1., 2.],
             [3., 4.]]]]) torch.Size([1, 1, 2, 2])
   tensor([[[[ 4., 11., 18.,  9.],
             [18., 37., 47., 21.],
             [36., 67., 77., 33.],
             [14., 23., 26.,  9.]]]])

對比結果可以發現, PyTorch中的2D卷積實際上是2D相關操作, 與此類似, Tensorflow等深度神經網路框架中的卷積均為相關操作. 但這并不影響網路的性能, 這是因為卷積核是通過網路學習的, 通過學習得到的卷積核可以看作是翻轉后卷積核.

參考文獻

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/293302.html

標籤:AI

上一篇:深度學習中Transformer的原理和方法(李宏毅視頻課筆記)

下一篇:【Pytorch學習筆記】3.深度學習基礎

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 2023年最新微信小程式抓包教程

    01 開門見山 隔一個月發一篇文章,不過分。 首先回顧一下《微信系結手機號資料庫被脫庫事件》,我也是第一時間得知了這個訊息,然后跟蹤了整件事情的經過。下面是這起事件的相關截圖以及近日流出的一萬條資料樣本: 個人認為這件事也沒什么,還不如關注一下之前45億快遞資料查詢渠道疑似在近日復活的訊息。 訊息是 ......

    uj5u.com 2023-04-20 08:48:24 more
  • web3 產品介紹:metamask 錢包 使用最多的瀏覽器插件錢包

    Metamask錢包是一種基于區塊鏈技術的數字貨幣錢包,它允許用戶在安全、便捷的環境下管理自己的加密資產。Metamask錢包是以太坊生態系統中最流行的錢包之一,它具有易于使用、安全性高和功能強大等優點。 本文將詳細介紹Metamask錢包的功能和使用方法。 一、 Metamask錢包的功能 數字資 ......

    uj5u.com 2023-04-20 08:47:46 more
  • vulnhub_Earth

    前言 靶機地址->>>vulnhub_Earth 攻擊機ip:192.168.20.121 靶機ip:192.168.20.122 參考文章 https://www.cnblogs.com/Jing-X/archive/2022/04/03/16097695.html https://www.cnb ......

    uj5u.com 2023-04-20 07:46:20 more
  • 從4k到42k,軟體測驗工程師的漲薪史,給我看哭了

    清明節一過,盲猜大家已經無心上班,在數著日子準備過五一,但一想到銀行卡里的余額……瞬間心情就不美麗了。最近,2023年高校畢業生就業調查顯示,本科畢業月平均起薪為5825元。調查一出,便有很多同學表示自己又被平均了。看著這一資料,不免讓人想到前不久中國青年報的一項調查:近六成大學生認為畢業10年內會 ......

    uj5u.com 2023-04-20 07:44:00 more
  • 最新版本 Stable Diffusion 開源 AI 繪畫工具之中文自動提詞篇

    🎈 標簽生成器 由于輸入正向提示詞 prompt 和反向提示詞 negative prompt 都是使用英文,所以對學習母語的我們非常不友好 使用網址:https://tinygeeker.github.io/p/ai-prompt-generator 這個網址是為了讓大家在使用 AI 繪畫的時候 ......

    uj5u.com 2023-04-20 07:43:36 more
  • 漫談前端自動化測驗演進之路及測驗工具分析

    隨著前端技術的不斷發展和應用程式的日益復雜,前端自動化測驗也在不斷演進。隨著 Web 應用程式變得越來越復雜,自動化測驗的需求也越來越高。如今,自動化測驗已經成為 Web 應用程式開發程序中不可或缺的一部分,它們可以幫助開發人員更快地發現和修復錯誤,提高應用程式的性能和可靠性。 ......

    uj5u.com 2023-04-20 07:43:16 more
  • CANN開發實踐:4個DVPP記憶體問題的典型案例解讀

    摘要:由于DVPP媒體資料處理功能對存放輸入、輸出資料的記憶體有更高的要求(例如,記憶體首地址128位元組對齊),因此需呼叫專用的記憶體申請介面,那么本期就分享幾個關于DVPP記憶體問題的典型案例,并給出原因分析及解決方法。 本文分享自華為云社區《FAQ_DVPP記憶體問題案例》,作者:昇騰CANN。 DVPP ......

    uj5u.com 2023-04-20 07:43:03 more
  • msf學習

    msf學習 以kali自帶的msf為例 一、msf核心模塊與功能 msf模塊都放在/usr/share/metasploit-framework/modules目錄下 1、auxiliary 輔助模塊,輔助滲透(埠掃描、登錄密碼爆破、漏洞驗證等) 2、encoders 編碼器模塊,主要包含各種編碼 ......

    uj5u.com 2023-04-20 07:42:59 more
  • Halcon軟體安裝與界面簡介

    1. 下載Halcon17版本到到本地 2. 雙擊安裝包后 3. 步驟如下 1.2 Halcon軟體安裝 界面分為四大塊 1. Halcon的五個助手 1) 影像采集助手:與相機連接,設定相機引數,采集影像 2) 標定助手:九點標定或是其它的標定,生成標定檔案及內參外參,可以將像素單位轉換為長度單位 ......

    uj5u.com 2023-04-20 07:42:17 more
  • 在MacOS下使用Unity3D開發游戲

    第一次發博客,先發一下我的游戲開發環境吧。 去年2月份買了一臺MacBookPro2021 M1pro(以下簡稱mbp),這一年來一直在用mbp開發游戲。我大致分享一下我的開發工具以及使用體驗。 1、Unity 官網鏈接: https://unity.cn/releases 我一般使用的Apple ......

    uj5u.com 2023-04-20 07:40:19 more