@Author:Runsen
影像分割是將影像分割成多個不同區域(或片段)的程序,目標是將影像的表示變成更容易和更有意義的影像,
在這篇博客中,我們將看到一種影像分割方法,即K-Means Clustering,
K-Means 聚類是一種無監督機器學習演算法,旨在將N 個觀測值劃分為K 個聚類,其中每個觀測值都屬于具有最近均值的聚類,集群是指由于某些相似性而聚合在一起的資料點的集合,對于影像分割,這里的簇是不同的影像顏色,
我們使用的環境是pip install opencv-python numpy matplotlib
選擇的圖片是我們學校畢業照的圖片,放心這里沒有我,在學校公眾號找的美圖,

匯入所需模塊:
import cv2
import numpy as np
import matplotlib.pyplot as plt
# read the image
image = cv2.imread("Graduation.jpg")
在進行影像分割之前,讓我們將影像轉換為RGB格式:
image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
我們將使用cv2.kmeans()函式,它將一個2D陣列作為輸入,并且由于我們的原始影像是3D(寬度、高度和深度為3 個 RGB值),我們需要將高度和寬度展平為單個像素向量(3 個 RGB值):
# 將影像重塑為像素和3個顏色值(RGB)的2D陣列
print(image.shape) #(853, 1280, 3)
pixel_values = image.reshape((-1, 3))
# 轉換為numpy的float32
pixel_values = np.float32(pixel_values)
print(pixel_values.shape) #(1091840, 3)
關于opencv下的kmean演算法,函式為cv2.kmeans()
函式的格式為:kmeans(data, K, bestLabels, criteria, attempts, flags)
- data: 分類資料,最好是np.float32的資料,每個特征放一列,之所以是np.float32原因是這種資料型別運算速度快,如果是uint型資料將會很慢,
- K: 分類數,opencv2的kmeans分類是需要已知分類數的,
- bestLabels:預設的分類標簽:沒有的話 None
- criteria:迭代停止的模式選擇,這是一個含有三個元素的元組型數,格式為
(type,max_iter,epsilon),max_iter迭代次數,epsilon結果的精確性
其中,type又有三種選擇:- cv2.TERM_CRITERIA_EPS :精確度(誤差)滿足epsilon停止,
- cv2.TERM_CRITERIA_MAX_ITER:迭代次數超過max_iter停止
- cv2.TERM_CRITERIA_EPS+cv2.TERM_CRITERIA_MAX_ITER,兩者合體,任意一個滿足結束,-
- attempts:重復試驗kmeans演算法次數,將會回傳最好的一次結果
- flags:初始類中心選擇,兩種方法
cv2.KMEANS_PP_CENTERS演算法kmeans++的center;cv2.KMEANS_RANDOM_CENTERS隨機初始化
在這里,我們需要設定criteria確定停止標準,我們將在超過某些迭代次數(例如500)時停止,或者如果集群移動小于某個 epsilon 值(讓我們在這里選擇0.1),下面的代碼在OpenCV 中定義了這個停止標準:
# 確定停止標準
criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 500, 0.1)
上面影像,會發現五種主要顏色(分別是天空、草地、樹、人的上身白,人的下身黑)
因此,我們將為這張圖片使用K=5:
k = 5
_, labels, (centers) = cv2.kmeans(pixel_values, k, None, criteria, 10, cv2.KMEANS_RANDOM_CENTERS)
cv2.KMEANS_RANDOM_CENTERS只是指示OpenCV最初隨機分配集群的值,
我們將扁平化的影像像素值轉換為浮點數32型別,是因為cv2.kmeans() 浮點數32型別,然后,讓我們將浮點數轉換回8 位像素值np.uint8(centers):
# 轉換回np.uint8
centers = np.uint8(centers)
# 展平標簽陣列
labels = labels.flatten()
segmented_image = centers[labels.flatten()]
轉換回原始影像形狀并顯示:
#重塑回原始影像尺寸
segmented_image = segmented_image.reshape(image.shape)
plt.imshow(segmented_image)
plt.show()

當然,我們還可以禁用影像中的一些K-Means 聚類集群,例如,讓我們禁用集群編號1并顯示影像:
# 禁用2號群集(將像素變為黑色)
masked_image = np.copy(segmented_image)
# 轉換為像素值向量的形狀
masked_image = masked_image.reshape((-1, 3))
cluster1 = 1
masked_image[labels == cluster1] = [0, 0, 0]
# 轉換回原始形狀
masked_image = masked_image.reshape(image.shape)
plt.imshow(masked_image)
plt.show()

原來K-Means 聚類2 號集群 是樹,
請注意,還有其他分割技術,例如霍夫變換、輪廓檢測和當前最先進的語意分割,
對此推薦大佬給你們
[Python影像處理] 四十.全網首發Python影像分割萬字詳解(閾值分割、邊緣分割、紋理分割、分水嶺演算法、K-Means分割、漫水填充分割、區域定位)
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/286200.html
標籤:AI
