原文鏈接:http://www.juzicode.com/opencv-python-image-gradient
回傳Opencv-Python教程
高斯平滑、雙邊平滑 和 均值平滑、中值平滑 介紹的平滑處理可以看做是影像的“低通濾波”,它會濾除掉影像的“高頻”部分,使影像看起來更平滑,而影像梯度則可以看做是對影像進行“高通濾波”,它會濾除影像中的低頻部分,為的是凸顯出影像的突變部分,在 形態學變換~開閉操作,頂帽黑帽,形態學梯度,擊中擊不中(morphologyEx) 一文中我們也接觸到了影像梯度的內容,今天繼續介紹幾種計算影像梯度的方法,
1、Sobel
Sobel 3×3尺寸的kernel如下圖所示,從kernel可以看到計算Sobel梯度會有x和y 2個方向的梯度:

以上圖3×3尺寸的Sobel kernel為例,x方向梯度是該點右側像素值的2倍加上右上、右下像素值的和減去左側像素值的2倍加上左上、左下像素值的和,該點的梯度值和自身無關,只和其左右2側的像素值有關,y方向的梯度則是和上下方向的像素值有關,
介面形式:
dst = cv2.Sobel(src, ddepth, dx, dy[, dst[, ksize[, scale[, delta[, borderType]]]]])
- 引數含義:
- src:源影像;
- ddepth:目標影像深度;
- dx:x方向求導階數;
- dy:y方向求導階數;
- dst:目標影像;
- ksize:kernel尺寸,說明檔案上指出必須是1,3,5,7中的一個,但是實驗可以得到應該是小于31的正奇數;如果是-1表示scharr濾波;
- scale:縮放比例,默認為1;
- delta:疊加值,默認為0;
- borderType:邊界填充型別;
下面這個例子中先設定dx=1,dy=0計算x方向的梯度,再設定dy=1,dx=0計算y方向的梯度,為了避免出現飽和運算,dtype設定的是比源影像資料型別CV_8U更高的CV_16S,然后將結果用convertScaleAbs()轉換回CV_8U(np.unit8)型別,最后用addWeighted()將x和y方向的梯度圖加權相加,
import matplotlib.pyplot as plt
import cv2
print('VX公眾號: 桔子code / juzicode.com')
print('cv2.__version__:',cv2.__version__)
plt.rc('font',family='Youyuan',size='9')
img_src = cv2.imread('..\\samples\\data\\sudoku.png' ,cv2.IMREAD_GRAYSCALE)
grad_x = cv2.Sobel(img_src, cv2.CV_16S, 1, 0, ksize=3)
grad_y = cv2.Sobel(img_src, cv2.CV_16S, 0, 1, ksize=3)
abs_grad_x = cv2.convertScaleAbs(grad_x)
abs_grad_y = cv2.convertScaleAbs(grad_y)
grad = cv2.addWeighted(abs_grad_x, 0.5, abs_grad_y, 0.5, 0)
fig,ax = plt.subplots(2,2)
ax[0,0].set_title('原圖(juzicode.com)')
ax[0,0].imshow(img_src ,cmap = 'gray')
ax[0,1].set_title('abs_grad_x')
ax[0,1].imshow(abs_grad_x,cmap = 'gray')
ax[1,0].set_title('abs_grad_y')
ax[1,0].imshow(abs_grad_y,cmap = 'gray')
ax[1,1].set_title('grad x+y')
ax[1,1].imshow(grad,cmap = 'gray')
ax[0,0].axis('off');ax[0,1].axis('off');ax[1,0].axis('off');ax[1,1].axis('off')#關閉坐標軸顯示
plt.show()
運行結果:

上圖右上角是沿x方向的梯度變化,左下角是沿y方向的梯度變化,右下角為2者各占一半權重組合的圖片,從組合后的梯度影像可以看到:原始影像的棋盤線和數字的邊沿部分變得更亮,而棋盤空白和數字中間這些亮度連續區域都變得更暗,最后起到了凸顯邊沿的效果,
如果dx和dy同時設定為1:grad_x_y = cv2.Sobel(img_src, cv2.CV_16S, 1, 1, ksize=3),我們來看下顯示的效果:
import matplotlib.pyplot as plt
import cv2
print('VX公眾號: 桔子code / juzicode.com')
print('cv2.__version__:',cv2.__version__)
plt.rc('font',family='Youyuan',size='9')
img_src = cv2.imread('..\\samples\\data\\sudoku.png' ,cv2.IMREAD_GRAYSCALE)
grad_x = cv2.Sobel(img_src, cv2.CV_16S, 1, 0, ksize=3)
grad_y = cv2.Sobel(img_src, cv2.CV_16S, 0, 1, ksize=3)
abs_grad_x = cv2.convertScaleAbs(grad_x)
abs_grad_y = cv2.convertScaleAbs(grad_y)
grad = cv2.addWeighted(abs_grad_x, 0.5, abs_grad_y, 0.5, 0)
#同時求x和y方向的梯度
grad_x_y = cv2.Sobel(img_src, cv2.CV_16S, 1, 1, ksize=3)
abs_grad_x_y = cv2.convertScaleAbs(grad_x_y)
fig,ax = plt.subplots(2,2)
ax[0,0].set_title('原圖(juzicode.com)')
ax[0,0].imshow(img_src ,cmap = 'gray')
ax[0,1].set_title('abs_grad_x')
ax[0,1].imshow(abs_grad_x,cmap = 'gray')
ax[1,0].set_title('grad_x+y')
ax[1,0].imshow(grad,cmap = 'gray')
ax[1,1].set_title('abs_grad_dx_dy=1')
ax[1,1].imshow(abs_grad_x_y,cmap = 'gray')
ax[0,0].axis('off');ax[0,1].axis('off');ax[1,0].axis('off');ax[1,1].axis('off')#關閉坐標軸顯示
plt.show()

從運行結果可以看到,當dx和dy同時設定為1對應上圖右下角影像,棋盤中水平和垂直方向線條的梯度都消失了,這里dx和dy都為1表明是與的關系,只有x和y方向都有梯度的時候才能被檢測出來,
接下來這個例子是設定不同的ksize:
import matplotlib.pyplot as plt
import cv2
print('VX公眾號: 桔子code / juzicode.com')
print('cv2.__version__:',cv2.__version__)
plt.rc('font',family='Youyuan',size='9')
img_src = cv2.imread('..\\samples\\data\\sudoku.png' ,cv2.IMREAD_GRAYSCALE)
print(img_src.shape)
grad_x_ksize1 = cv2.Sobel(img_src, cv2.CV_16S, 1, 0, ksize=1)
grad_x_ksize3 = cv2.Sobel(img_src, cv2.CV_16S, 1, 0, ksize=3)
grad_x_ksize5 = cv2.Sobel(img_src, cv2.CV_16S, 1, 0, ksize=5)
#設定不同的ksize值
abs_grad_x_ksize1 = cv2.convertScaleAbs(grad_x_ksize1)
abs_grad_x_ksize3 = cv2.convertScaleAbs(grad_x_ksize3)
abs_grad_x_ksize5 = cv2.convertScaleAbs(grad_x_ksize5)
#顯示
fig,ax = plt.subplots(2,2)
ax[0,0].set_title('原圖(juzicode.com)')
ax[0,0].imshow(img_src ,cmap = 'gray')
ax[0,1].set_title('abs_grad_x_ksize=1')
ax[0,1].imshow(abs_grad_x_ksize1,cmap = 'gray')
ax[1,0].set_title('abs_grad_x_ksize=3')
ax[1,0].imshow(abs_grad_x_ksize3,cmap = 'gray')
ax[1,1].set_title('abs_grad_x_ksize=5')
ax[1,1].imshow(abs_grad_x_ksize5,cmap = 'gray')
ax[0,0].axis('off');ax[0,1].axis('off');ax[1,0].axis('off');ax[1,1].axis('off')#關閉坐標軸顯示
plt.show()

上面的例子中ksize依次設定為1,3,5,從運行結果可以看到ksize的值越大,梯度資訊呈現的越多,
下面再設定不同的求導階數,這里以x方向的dx為例,在ksize=5的時候設定dx分別為1,2,3,這里需要注意dx的值要小于ksize:
import matplotlib.pyplot as plt
import cv2
print('VX公眾號: 桔子code / juzicode.com')
print('cv2.__version__:',cv2.__version__)
plt.rc('font',family='Youyuan',size='9')
img_src = cv2.imread('..\\samples\\data\\sudoku.png' ,cv2.IMREAD_GRAYSCALE)
#相同的ksize,不同的dx
grad_order1 = cv2.Sobel(img_src, cv2.CV_16S, 1, 0, ksize=5)
grad_order2 = cv2.Sobel(img_src, cv2.CV_16S, 2, 0, ksize=5)
grad_order3 = cv2.Sobel(img_src, cv2.CV_16S, 3, 0, ksize=5)
abs_grad_order1 = cv2.convertScaleAbs(grad_order1)
abs_grad_order2 = cv2.convertScaleAbs(grad_order2)
abs_grad_order3 = cv2.convertScaleAbs(grad_order3)
fig,ax = plt.subplots(2,2)
ax[0,0].set_title('原圖(juzicode.com)')
ax[0,0].imshow(img_src ,cmap = 'gray')
ax[0,1].set_title('abs_grad_order1')
ax[0,1].imshow(abs_grad_order1,cmap = 'gray')
ax[1,0].set_title('abs_grad_order2')
ax[1,0].imshow(abs_grad_order2,cmap = 'gray')
ax[1,1].set_title('abs_grad_order3')
ax[1,1].imshow(abs_grad_order3,cmap = 'gray')
ax[0,0].axis('off');ax[0,1].axis('off');ax[1,0].axis('off');ax[1,1].axis('off')#關閉坐標軸顯示
plt.show()

從運行結果可以看到在相同的ksize下,dx的值越小,梯度的細節越多,
2、Scharr
當kernel的尺寸為3×3時,Sobel計算的結果不是很精確,為了得到更精確的計算結果常采用下圖所示的Scharr kernel:

Scharr變換可以看做是使用了Scharr核的Sobel變換,是一種經過改進的Sobel變換,同樣也要區分x和y方向分開計算梯度,
介面形式:
dst = cv2.Scharr(src, ddepth, dx, dy[, dst[, scale[, delta[, borderType]]]])
- 引數含義:
- src:源影像;
- ddepth:目標影像深度;
- dx:x方向求導階數;
- dy:y方向求導階數;
- dst:目標影像;
- scale:縮放比例,默認為1;
- delta:疊加值,默認為0;
- borderType:邊界填充型別;
注意Scharr()沒有ksize引數,因為Scharr kernel的大小固定為3×3,
下面這個例子類似前面用Sobel()計算影像梯度時,先計算x方向梯度,再計算y方向梯度,然后加權生成總的梯度影像:
import matplotlib.pyplot as plt
import cv2
print('VX公眾號: 桔子code / juzicode.com')
print('cv2.__version__:',cv2.__version__)
plt.rc('font',family='Youyuan',size='9')
img_src = cv2.imread('..\\samples\\data\\sudoku.png' ,cv2.IMREAD_GRAYSCALE)
grad_x = cv2.Scharr(img_src,cv2.CV_16S,1,0)
grad_y = cv2.Scharr(img_src,cv2.CV_16S,0,1)
abs_grad_x = cv2.convertScaleAbs(grad_x)
abs_grad_y = cv2.convertScaleAbs(grad_y)
grad = cv2.addWeighted(abs_grad_x, 0.5, abs_grad_y, 0.5, 0)
fig,ax = plt.subplots(2,2)
ax[0,0].set_title('原圖(juzicode.com)')
ax[0,0].imshow(img_src ,cmap = 'gray')
ax[0,1].set_title('abs_grad_x')
ax[0,1].imshow(abs_grad_x,cmap = 'gray')
ax[1,0].set_title('abs_grad_y')
ax[1,0].imshow(abs_grad_y,cmap = 'gray')
ax[1,1].set_title('grad-x+y')
ax[1,1].imshow(grad,cmap = 'gray')
ax[0,0].axis('off');ax[0,1].axis('off');ax[1,0].axis('off');ax[1,1].axis('off')
plt.show()
運行結果:

需要注意的是在計算Scharr梯度時,dx和dy要滿足如下的關系,否則會拋例外:
CV_Assert( dx >= 0 && dy >= 0 && dx+dy == 1 )
也就是每次只能求x方向或者y方向單個方向的梯度,而且只能求一階梯度,不像Sobel()中dx或dy可以設定為更大的值計算更高階的梯度,
3、Laplacian
Laplacian變換是對影像求二階導數,下圖是2種3×3尺寸的kernel,這里ksize是Laplacian()的入參名稱:

Laplacian()變換不需要區分影像的x和y方向計算梯度,從上圖的2種kernel也可以看到其x和y方向是對稱的,
在Laplacian()變換中,ksize必須是小于31的正奇數,但是當ksize等于1時,這時kernel的尺寸大小并非是1,其實際尺寸仍然為3×3,這點從原始碼上可以看到當ksize=1時,實際為一個包含9個元素的3×3尺寸的kernel:
if( ksize == 1 || ksize == 3 ){
float K[2][9] = {
{ 0, 1, 0, 1, -4, 1, 0, 1, 0 }, //ksize==1時的kernel
{ 2, 0, 2, 0, -8, 0, 2, 0, 2 } //ksize==3時的kernel
};
Mat kernel(3, 3, CV_32F, K[ksize == 3]);
......
}
介面形式:
dst = cv2.Laplacian(src, ddepth[, dst[, ksize[, scale[, delta[, borderType]]]]])
- 引數含義:
- src:源影像;
- ddepth:目標影像深度;
- dst:目標影像;
- ksize:kernel尺寸,小于31的正奇數;如果為1仍然是一個3×3的kernel;
- scale:縮放比例,默認為1;
- delta:疊加值,默認為0;
- borderType:邊界填充型別;
Laplacian變換中沒有dx或dy引數,因為Laplacian是對影像求二階導數,
下面這個例子顯示了Laplacian中不同的ksize差異,以及和Sobel的對比:
import matplotlib.pyplot as plt
import cv2
print('VX公眾號: 桔子code / juzicode.com')
print('cv2.__version__:',cv2.__version__)
plt.rc('font',family='Youyuan',size='9')
img_src = cv2.imread('..\\samples\\data\\sudoku.png' ,cv2.IMREAD_GRAYSCALE)
#Laplacian
grad_lap = cv2.Laplacian(img_src,cv2.CV_16S,ksize=1)
abs_grad_lap1 = cv2.convertScaleAbs(grad_lap)
grad_lap = cv2.Laplacian(img_src,cv2.CV_16S,ksize=3)
abs_grad_lap3 = cv2.convertScaleAbs(grad_lap)
grad_lap = cv2.Laplacian(img_src,cv2.CV_16S,ksize=5)
abs_grad_lap5 = cv2.convertScaleAbs(grad_lap)
#二階Sobel
grad_x = cv2.Sobel(img_src, cv2.CV_16S, 2, 0, ksize=3)
grad_y = cv2.Sobel(img_src, cv2.CV_16S, 0, 2, ksize=3)
abs_grad_x = cv2.convertScaleAbs(grad_x)
abs_grad_y = cv2.convertScaleAbs(grad_y)
abs_grad_sobel = cv2.addWeighted(abs_grad_x, 0.5, abs_grad_y, 0.5, 0)
#顯示
fig,ax = plt.subplots(2,3)
ax[0,0].set_title('原圖(juzicode.com)')
ax[0,0].imshow(img_src ,cmap = 'gray')
ax[0,1].set_title('abs_grad_sobel')
ax[0,1].imshow(abs_grad_sobel,cmap = 'gray')
ax[1,0].set_title('abs_grad_lap1')
ax[1,0].imshow(abs_grad_lap1,cmap = 'gray')
ax[1,1].set_title('abs_grad_lap3')
ax[1,1].imshow(abs_grad_lap3,cmap = 'gray')
ax[1,2].set_title('abs_grad_lap5')
ax[1,2].imshow(abs_grad_lap5,cmap = 'gray')
ax[0,0].axis('off');ax[0,1].axis('off');ax[0,2].axis('off')#關閉坐標軸顯示
ax[1,0].axis('off');ax[1,1].axis('off');ax[1,2].axis('off')
plt.show()
運行結果:

從運行結果可以看到Laplacian()中ksize越大,梯度資訊越豐富,這點和Sobel變換是一樣的,另外在相同的ksize時,二階Sobel變換和Laplacian變換對比看,Laplacian變換取得的梯度資訊要更明顯一些,
擴展閱讀:
- OpenCV-Python教程
- 論如何把自己變成卡通人物(OpenCV制作卡通化頭像)
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/317709.html
標籤:其他
