卷積神經網路的特征映射的值以影像和過濾器(卷積核)的相似度作為輸入資訊,卷積的程序表示如下:
假設由3x3像素構成的兩幅圖A,F,從矩陣向量相似的角度看,他們的相似度可以像下面這樣求出:

這個定理可以利用向量的性質來說明,根據線性空間理論,當兩個向量相似時,他們的內積
較大,我們可以認為內積
大小表示兩個向量的相似性,
圖形化表示如下圖,可以看到,當向量i和向量u方向大致相同時(夾角為銳角),紅色的投影長度比較大,而當兩向量垂直時,投影為零,并且當向量夾角為鈍角的時候,投影為負的向量,代表差異最大,

所以,為了利用這個性質,可以將兩幅影像看成是向量:
這樣一來,通過內積,卷積便和相似性聯系起來,也就是說,我們可以把CNN中卷積的計算程序理解為提取影像區域和卷積核所表示的特征的相似度,
我們以數字2的識別為例,通過用一個3*3的卷積核來提取數字二的斜45度角特征,
可以看到,這個卷積核正確的提取了斜邊的特征,和卷積核方向相同的部分,對應的卷積為3,其余所有有比零大的卷積結果,對應的單元中都有對應的斜邊模式,從實踐上這說明了通過設計合理的卷積核來提取影像特征的方法是合理的.
結束!
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/330452.html
標籤:其他

