畢業了，在Python中使用 OpenCV 和K-Means 聚類對畢業照進行影像分割-有解無憂

@Author：Runsen

影像分割是將影像分割成多個不同區域（或片段）的程序，目標是將影像的表示變成更容易和更有意義的影像，

在這篇博客中，我們將看到一種影像分割方法，即K-Means Clustering，

K-Means 聚類是一種無監督機器學習演算法，旨在將N 個觀測值劃分為K 個聚類，其中每個觀測值都屬于具有最近均值的聚類，集群是指由于某些相似性而聚合在一起的資料點的集合，對于影像分割，這里的簇是不同的影像顏色，

我們使用的環境是pip install opencv-python numpy matplotlib

選擇的圖片是我們學校畢業照的圖片，放心這里沒有我，在學校公眾號找的美圖，

匯入所需模塊：

import cv2
import numpy as np
import matplotlib.pyplot as plt
# read the image
image = cv2.imread("Graduation.jpg")

在進行影像分割之前，讓我們將影像轉換為RGB格式：

image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)

我們將使用cv2.kmeans()函式，它將一個2D陣列作為輸入，并且由于我們的原始影像是3D（寬度、高度和深度為3 個 RGB值），我們需要將高度和寬度展平為單個像素向量（3 個 RGB值）：

# 將影像重塑為像素和3個顏色值（RGB）的2D陣列
print(image.shape) #(853, 1280, 3)
pixel_values = image.reshape((-1, 3))
# 轉換為numpy的float32
pixel_values = np.float32(pixel_values)
print(pixel_values.shape) #(1091840, 3)

關于opencv下的kmean演算法，函式為cv2.kmeans()
函式的格式為：kmeans(data, K, bestLabels, criteria, attempts, flags)

data: 分類資料，最好是np.float32的資料，每個特征放一列，之所以是np.float32原因是這種資料型別運算速度快，如果是uint型資料將會很慢，
K: 分類數，opencv2的kmeans分類是需要已知分類數的，
bestLabels：預設的分類標簽：沒有的話 None
criteria：迭代停止的模式選擇，這是一個含有三個元素的元組型數，格式為（type,max_iter,epsilon），max_iter迭代次數，epsilon結果的精確性
其中，type又有三種選擇：
- cv2.TERM_CRITERIA_EPS :精確度（誤差）滿足epsilon停止，
- cv2.TERM_CRITERIA_MAX_ITER：迭代次數超過max_iter停止
- cv2.TERM_CRITERIA_EPS+cv2.TERM_CRITERIA_MAX_ITER，兩者合體，任意一個滿足結束，-
attempts：重復試驗kmeans演算法次數，將會回傳最好的一次結果
flags：初始類中心選擇，兩種方法
cv2.KMEANS_PP_CENTERS 演算法kmeans++的center; cv2.KMEANS_RANDOM_CENTERS隨機初始化

在這里，我們需要設定criteria確定停止標準，我們將在超過某些迭代次數（例如500）時停止，或者如果集群移動小于某個 epsilon 值（讓我們在這里選擇0.1），下面的代碼在OpenCV 中定義了這個停止標準：

# 確定停止標準
criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 500, 0.1)

上面影像，會發現五種主要顏色（分別是天空、草地、樹、人的上身白，人的下身黑）

因此，我們將為這張圖片使用K=5：

k = 5
_, labels, (centers) = cv2.kmeans(pixel_values, k, None, criteria, 10, cv2.KMEANS_RANDOM_CENTERS)

cv2.KMEANS_RANDOM_CENTERS只是指示OpenCV最初隨機分配集群的值，

我們將扁平化的影像像素值轉換為浮點數32型別，是因為cv2.kmeans() 浮點數32型別，然后，讓我們將浮點數轉換回8 位像素值np.uint8(centers)：

# 轉換回np.uint8
centers = np.uint8(centers)

# 展平標簽陣列
labels = labels.flatten()

segmented_image = centers[labels.flatten()]

轉換回原始影像形狀并顯示：

#重塑回原始影像尺寸
segmented_image = segmented_image.reshape(image.shape)
plt.imshow(segmented_image)
plt.show()

當然，我們還可以禁用影像中的一些K-Means 聚類集群，例如，讓我們禁用集群編號1并顯示影像：

# 禁用2號群集（將像素變為黑色）
masked_image = np.copy(segmented_image)
# 轉換為像素值向量的形狀
masked_image = masked_image.reshape((-1, 3))
cluster1 = 1
masked_image[labels == cluster1] = [0, 0, 0]
# 轉換回原始形狀
masked_image = masked_image.reshape(image.shape)
plt.imshow(masked_image)
plt.show()

在這里插入圖片描述
原來K-Means 聚類2 號集群是樹，

請注意，還有其他分割技術，例如霍夫變換、輪廓檢測和當前最先進的語意分割，

對此推薦大佬給你們

[Python影像處理] 四十.全網首發Python影像分割萬字詳解（閾值分割、邊緣分割、紋理分割、分水嶺演算法、K-Means分割、漫水填充分割、區域定位）

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/286200.html

標籤：AI

上一篇：只用70行代碼，手把手教你遍歷當前windows所有行程！

下一篇：一文回顧 Java 入門知識（中）