摘要:影像銳化和邊緣提取技術可以消除影像中的噪聲,提取影像資訊中用來表征影像的一些變數,為影像識別提供基礎,
本文分享自華為云社區《[Python影像處理] 十七.影像銳化與邊緣檢測之Roberts算子、Prewitt算子、Sobel算子和Laplacian算》,作者: eastmount ,
由于收集影像資料的器件或傳輸數影像的通道的存在一些質量缺陷,文物影像時間久遠,或者受一些其他外界因素、動態不穩定抓取影像的影響,使得影像存在模糊和有噪聲的情況,從而影響到影像識別作業的開展,這時需要開展影像銳化和邊緣檢測處理,加強原影像的高頻部分,銳化突出影像的邊緣細節,改善影像的對比度,使模糊的影像變得更清晰,
影像銳化和邊緣提取技術可以消除影像中的噪聲,提取影像資訊中用來表征影像的一些變數,為影像識別提供基礎,通常使用灰度差分法對影像的邊緣、輪廓進行處理,將其凸顯,本文分別采用Laplacian算子、Robert算子、Prewitt算子和Sobel算子進行影像銳化邊緣處理實驗,本文主要講解灰度線性變換,基礎性知識希望對您有所幫助,
該系列在github所有源代碼:https://github.com/eastmountyxz/ImageProcessing-Python
一.Roberts算子
Roberts算子又稱為交叉微分演算法,它是基于交叉差分的梯度演算法,通過區域差分計算檢測邊緣線條,常用來處理具有陡峭的低噪聲影像,當影像邊緣接近于正45度或負45度時,該演算法處理效果更理想,其缺點是對邊緣的定位不太準確,提取的邊緣線條較粗,
Roberts算子的模板分為水平方向和垂直方向,如公式(11.7)所示,從其模板可以看出,Roberts算子能較好的增強正負45度的影像邊緣,
詳細計算公式如下所示:(PS-下圖參考自己的書和論文)
在Python中,Roberts算子主要通過Numpy定義模板,再呼叫OpenCV的filter2D()函式實作邊緣提取,該函式主要是利用內核實作對影像的卷積運算,其函式原型如下所示:
dst = filter2D(src, ddepth, kernel[, dst[, anchor[, delta[, borderType]]]])
- src表示輸入影像
- dst表示輸出的邊緣圖,其大小和通道數與輸入影像相同
- ddepth表示目標影像所需的深度
- kernel表示卷積核,一個單通道浮點型矩陣
- anchor表示內核的基準點,其默認值為(-1,-1),位于中心位置
- delta表示在儲存目標影像前可選的添加到像素的值,默認值為0
- borderType表示邊框模式
Python實作代碼如下所示:
# -*- coding: utf-8 -*- import cv2 import numpy as np import matplotlib.pyplot as plt #讀取影像 img = cv2.imread('lena.png') lenna_img = cv2.cvtColor(img,cv2.COLOR_BGR2RGB) #灰度化處理影像 grayImage = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) #Roberts算子 kernelx = np.array([[-1,0],[0,1]], dtype=int) kernely = np.array([[0,-1],[1,0]], dtype=int) x = cv2.filter2D(grayImage, cv2.CV_16S, kernelx) y = cv2.filter2D(grayImage, cv2.CV_16S, kernely) #轉uint8 absX = cv2.convertScaleAbs(x) absY = cv2.convertScaleAbs(y) Roberts = cv2.addWeighted(absX,0.5,absY,0.5,0) #用來正常顯示中文標簽 plt.rcParams['font.sans-serif']=['SimHei'] #顯示圖形 titles = [u'原始影像', u'Roberts算子'] images = [lenna_img, Roberts] for i in xrange(2): plt.subplot(1,2,i+1), plt.imshow(images[i], 'gray') plt.title(titles[i]) plt.xticks([]),plt.yticks([]) plt.show()
運行結果如下圖所示:
二.Prewitt算子
Prewitt是一種影像邊緣檢測的微分算子,其原理是利用特定區域內像素灰度值產生的差分實作邊緣檢測,由于Prewitt算子采用33模板對區域內的像素值進行計算,而Robert算子的模板為22,故Prewitt算子的邊緣檢測結果在水平方向和垂直方向均比Robert算子更加明顯,Prewitt算子適合用來識別噪聲較多、灰度漸變的影像,其計算公式如下所示,
在Python中,Prewitt算子的實作程序與Roberts算子比較相似,通過Numpy定義模板,再呼叫OpenCV的filter2D()函式實作對影像的卷積運算,最終通過convertScaleAbs()和addWeighted()函式實作邊緣提取,代碼如下所示:
# -*- coding: utf-8 -*- import cv2 import numpy as np import matplotlib.pyplot as plt #讀取影像 img = cv2.imread('lena.png') lenna_img = cv2.cvtColor(img,cv2.COLOR_BGR2RGB) #灰度化處理影像 grayImage = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) #Prewitt算子 kernelx = np.array([[1,1,1],[0,0,0],[-1,-1,-1]],dtype=int) kernely = np.array([[-1,0,1],[-1,0,1],[-1,0,1]],dtype=int) x = cv2.filter2D(grayImage, cv2.CV_16S, kernelx) y = cv2.filter2D(grayImage, cv2.CV_16S, kernely) #轉uint8 absX = cv2.convertScaleAbs(x) absY = cv2.convertScaleAbs(y) Prewitt = cv2.addWeighted(absX,0.5,absY,0.5,0) #用來正常顯示中文標簽 plt.rcParams['font.sans-serif']=['SimHei'] #顯示圖形 titles = [u'原始影像', u'Prewitt算子'] images = [lenna_img, Prewitt] for i in xrange(2): plt.subplot(1,2,i+1), plt.imshow(images[i], 'gray') plt.title(titles[i]) plt.xticks([]),plt.yticks([]) plt.show()
輸出結果如下圖所示,左邊為原始影像,右邊為Prewitt算子影像銳化提取的邊緣輪廓,其效果圖的邊緣檢測結果在水平方向和垂直方向均比Robert算子更加明顯,
三.Sobel算子
Sobel算子是一種用于邊緣檢測的離散微分算子,它結合了高斯平滑和微分求導,該算子用于計算影像明暗程度近似值,根據影像邊緣旁邊明暗程度把該區域內超過某個數的特定點記為邊緣,Sobel算子在Prewitt算子的基礎上增加了權重的概念,認為相鄰點的距離遠近對當前像素點的影響是不同的,距離越近的像素點對應當前像素的影響越大,從而實作影像銳化并突出邊緣輪廓,
Sobel算子的邊緣定位更準確,常用于噪聲較多、灰度漸變的影像,其演算法模板如公式所示,其中dx表示水平方向,dy表示垂直方向,
Sobel算子根據像素點上下、左右鄰點灰度加權差,在邊緣處達到極值這一現象檢測邊緣,對噪聲具有平滑作用,提供較為精確的邊緣方向資訊,因為Sobel算子結合了高斯平滑和微分求導(分化),因此結果會具有更多的抗噪性,當對精度要求不是很高時,Sobel算子是一種較為常用的邊緣檢測方法,
dst = Sobel(src, ddepth, dx, dy[, dst[, ksize[, scale[, delta[, borderType]]]]])
- src表示輸入影像
- dst表示輸出的邊緣圖,其大小和通道數與輸入影像相同
- ddepth表示目標影像所需的深度,針對不同的輸入影像,輸出目標影像有不同的深度
- dx表示x方向上的差分階數,取值1或 0
- dy表示y方向上的差分階數,取值1或0
- ksize表示Sobel算子的大小,其值必須是正數和奇數
- scale表示縮放導數的比例常數,默認情況下沒有伸縮系數
- delta表示將結果存入目標影像之前,添加到結果中的可選增量值
- borderType表示邊框模式,更多詳細資訊查閱BorderTypes
注意,在進行Sobel算子處理之后,還需要呼叫convertScaleAbs()函式計算絕對值,并將影像轉換為8位圖進行顯示,其演算法原型如下:
dst = convertScaleAbs(src[, dst[, alpha[, beta]]])
- src表示原陣列
- dst表示輸出陣列,深度為8位
- alpha表示比例因子
- beta表示原陣列元素按比例縮放后添加的值
Sobel算子的實作代碼如下所示:
# -*- coding: utf-8 -*- import cv2 import numpy as np import matplotlib.pyplot as plt #讀取影像 img = cv2.imread('lena.png') lenna_img = cv2.cvtColor(img,cv2.COLOR_BGR2RGB) #灰度化處理影像 grayImage = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) #Sobel算子 x = cv2.Sobel(grayImage, cv2.CV_16S, 1, 0) #對x求一階導 y = cv2.Sobel(grayImage, cv2.CV_16S, 0, 1) #對y求一階導 absX = cv2.convertScaleAbs(x) absY = cv2.convertScaleAbs(y) Sobel = cv2.addWeighted(absX, 0.5, absY, 0.5, 0) #用來正常顯示中文標簽 plt.rcParams['font.sans-serif']=['SimHei'] #顯示圖形 titles = [u'原始影像', u'Sobel算子'] images = [lenna_img, Sobel] for i in xrange(2): plt.subplot(1,2,i+1), plt.imshow(images[i], 'gray') plt.title(titles[i]) plt.xticks([]),plt.yticks([]) plt.show()
最終輸出結果如下圖所示:
四.Laplacian算子
拉普拉斯(Laplacian)算子是n維歐幾里德空間中的一個二階微分算子,常用于影像增強領域和邊緣提取,它通過灰度差分計算鄰域內的像素,基本流程是:判斷影像中心像素灰度值與它周圍其他像素的灰度值,如果中心像素的灰度更高,則提升中心像素的灰度;反之降低中心像素的灰度,從而實作影像銳化操作,在演算法實作程序中,Laplacian算子通過對鄰域中心像素的四方向或八方向求梯度,再將梯度相加起來判斷中心像素灰度與鄰域內其他像素灰度的關系,最后通過梯度運算的結果對像素灰度進行調整,
Laplacian算子分為四鄰域和八鄰域,四鄰域是對鄰域中心像素的四方向求梯度,八鄰域是對八方向求梯度,其中,四鄰域模板如公式所示:
通過模板可以發現,當鄰域內像素灰度相同時,模板的卷積運算結果為0;當中心像素灰度高于鄰域內其他像素的平均灰度時,模板的卷積運算結果為正數;當中心像素的灰度低于鄰域內其他像素的平均灰度時,模板的卷積為負數,對卷積運算的結果用適當的衰弱因子處理并加在原中心像素上,就可以實作影像的銳化處理,
Laplacian算子的八鄰域模板如下:
Python和OpenCV將Laplacian算子封裝在Laplacian()函式中,其函式原型如下所示:
dst = Laplacian(src, ddepth[, dst[, ksize[, scale[, delta[, borderType]]]]])
- src表示輸入影像
- dst表示輸出的邊緣圖,其大小和通道數與輸入影像相同
- ddepth表示目標影像所需的深度
- ksize表示用于計算二階導數的濾波器的孔徑大小,其值必須是正數和奇數,且默認值為1,更多詳細資訊查閱getDerivKernels
- scale表示計算拉普拉斯算子值的可選比例因子,默認值為1,更多詳細資訊查閱getDerivKernels
- delta表示將結果存入目標影像之前,添加到結果中的可選增量值,默認值為0
- borderType表示邊框模式,更多詳細資訊查閱BorderTypes
注意,Laplacian算子其實主要是利用Sobel算子的運算,通過加上Sobel算子運算出的影像x方向和y方向上的導數,得到輸入影像的影像銳化結果,同時,在進行Laplacian算子處理之后,還需要呼叫convertScaleAbs()函式計算絕對值,并將影像轉換為8位圖進行顯示,
當ksize=1時,Laplacian()函式采用3×3的孔徑(四鄰域模板)進行變換處理,下面的代碼是采用ksize=3的Laplacian算子進行影像銳化處理,其代碼如下:
# -*- coding: utf-8 -*- import cv2 import numpy as np import matplotlib.pyplot as plt #讀取影像 img = cv2.imread('lena.png') lenna_img = cv2.cvtColor(img,cv2.COLOR_BGR2RGB) #灰度化處理影像 grayImage = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) #拉普拉斯演算法 dst = cv2.Laplacian(grayImage, cv2.CV_16S, ksize = 3) Laplacian = cv2.convertScaleAbs(dst) #用來正常顯示中文標簽 plt.rcParams['font.sans-serif']=['SimHei'] #顯示圖形 titles = [u'原始影像', u'Laplacian算子'] images = [lenna_img, Laplacian] for i in xrange(2): plt.subplot(1,2,i+1), plt.imshow(images[i], 'gray') plt.title(titles[i]) plt.xticks([]),plt.yticks([]) plt.show()
最終輸出結果如下圖所示:
五.總結代碼
邊緣檢測演算法主要是基于影像強度的一階和二階導數,但導數通常對噪聲很敏感,因此需要采用濾波器來過濾噪聲,并呼叫影像增強或閾值化演算法進行處理,最后再進行邊緣檢測,下面是采用高斯濾波去噪和閾值化處理之后,再進行邊緣檢測的程序,并對比了四種常見的邊緣提取演算法,
# -*- coding: utf-8 -*- import cv2 import numpy as np import matplotlib.pyplot as plt #讀取影像 img = cv2.imread('lena.png') lenna_img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) #灰度化處理影像 grayImage = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) #高斯濾波 gaussianBlur = cv2.GaussianBlur(grayImage, (3,3), 0) #閾值處理 ret, binary = cv2.threshold(gaussianBlur, 127, 255, cv2.THRESH_BINARY) #Roberts算子 kernelx = np.array([[-1,0],[0,1]], dtype=int) kernely = np.array([[0,-1],[1,0]], dtype=int) x = cv2.filter2D(binary, cv2.CV_16S, kernelx) y = cv2.filter2D(binary, cv2.CV_16S, kernely) absX = cv2.convertScaleAbs(x) absY = cv2.convertScaleAbs(y) Roberts = cv2.addWeighted(absX, 0.5, absY, 0.5, 0) #Prewitt算子 kernelx = np.array([[1,1,1],[0,0,0],[-1,-1,-1]], dtype=int) kernely = np.array([[-1,0,1],[-1,0,1],[-1,0,1]], dtype=int) x = cv2.filter2D(binary, cv2.CV_16S, kernelx) y = cv2.filter2D(binary, cv2.CV_16S, kernely) absX = cv2.convertScaleAbs(x) absY = cv2.convertScaleAbs(y) Prewitt = cv2.addWeighted(absX,0.5,absY,0.5,0) #Sobel算子 x = cv2.Sobel(binary, cv2.CV_16S, 1, 0) y = cv2.Sobel(binary, cv2.CV_16S, 0, 1) absX = cv2.convertScaleAbs(x) absY = cv2.convertScaleAbs(y) Sobel = cv2.addWeighted(absX, 0.5, absY, 0.5, 0) #拉普拉斯演算法 dst = cv2.Laplacian(binary, cv2.CV_16S, ksize = 3) Laplacian = cv2.convertScaleAbs(dst) #效果圖 titles = ['Source Image', 'Binary Image', 'Roberts Image', 'Prewitt Image','Sobel Image', 'Laplacian Image'] images = [lenna_img, binary, Roberts, Prewitt, Sobel, Laplacian] for i in np.arange(6): plt.subplot(2,3,i+1),plt.imshow(images[i],'gray') plt.title(titles[i]) plt.xticks([]),plt.yticks([]) plt.show()
輸出結果如圖所示,其中,Laplacian算子對噪聲比較敏感,由于其演算法可能會出現雙像素邊界,常用來判斷邊緣像素位于影像的明區或暗區,很少用于邊緣檢測;Robert算子對陡峭的低噪聲影像效果較好,尤其是邊緣正負45度較多的影像,但定位準確率較差;Prewitt算子對灰度漸變的影像邊緣提取效果較好,而沒有考慮相鄰點的距離遠近對當前像素點的影響;Sobel算子考慮了綜合因素,對噪聲較多的影像處理效果更好,
點擊關注,第一時間了解華為云新鮮技術~
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/505939.html
標籤:Python
