作業要求:
在本節中, 我們想要通過自己撰寫一個K-Means函式來更加深入的理解K-Means演算法的流程. 并且在輸出k個中心點位置和k個分組的基礎上, 還想在每一次迭代中畫出當前中心點的位置, 以便將這個演算法動態的展示出來.
↓↓↓ 交作業點擊下面鏈接
鏈接失效了
附上完整代碼
(1)
# 定義函式
my_kmeans = function(data, k, err){
# 匯入資料
dat = as.matrix(data)
# 選取k個初始中心
idx = sample(1:nrow(data),k)
c = matrix(NA, nrow = k, ncol = ncol(dat))
for(n in 1:k){
c[n,] = dat[idx[n],]
}
# 保存每次迭代的中心點
save = list(c)
# 迭代次數
count = 0
repeat{
# 計算每一個樣本對于聚類中心的距離,保存在一個150*k的矩陣中
mat = matrix(NA, nrow = nrow(dat), ncol = k)
for(i in 1:nrow(dat)){
x = dat[i,]
for(j in 1:k){
mat[i,j] = sqrt(sum((x - c[j,])^2))
}
}
groups = apply(mat, 1,which.min)
cnew = matrix(NA, nrow = k, ncol = ncol(dat))
for(n in 1:k){
cnew[n,] = apply(dat[groups == n,], 2, mean)
}
# 終止條件
condition = c()
for(n in 1:k){
condition[n] = sqrt(sum((cnew[n,] - c[n,])^2)) < err
}
for(n in 1:k){
c[n,] = cnew[n,]
}
save = c(save,list(c))
count = count + 1
if( !(F %in% condition) )
break
}
result = list(groups,c)
names(result) = c("Groups","Cluster_centers")
return(c(result,list(save,count)))
}
(2)
dat = iris[,1:2] # 資料
k = 3 # 分幾類
# 參考函式
re = my_kmeans(iris[,1:2], 3, 1e-10)
# 提前設定好顏色
## install.packages("RColorBrewer")
library(RColorBrewer)
display.brewer.pal(12,"Paired")
co = brewer.pal(12,"Paired") # 配置的顏色數目不能超過k
# 動圖展示聚類中心的變化程序
## install.packages("animation")
library(animation)
saveGIF(
{
for(i in c( 0:re[[4]], rep(re[[4]],5) )){ # rep這里是為了讓最終的聚類中心停留更長時間
# 底圖部分
plot(x=iris[,1], y=iris[,2], col=re$Groups,
xlab='花萼長度', ylab='花萼寬度', asp=1, type="n",
main="每次迭代中心點的變化")
for(j in 1:k){
points(dat[re$Groups == j,][,1:2],col=co[j])
}
# 變化部分
points(re[[3]][[i+1]][,1:2],pch=22,cex=2,
col=co[1:k],bg=co[1:k])
# 增加部分
if(i == re[[4]]){
text(7.2,4.5,labels = "聚類中心", cex=1.5)
}
}
}, interval=0.5, ani.width=400, ani.height=400, movie.name="娜可露露.gif"
)
結果展示:

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/357239.html
標籤:AI
上一篇:自動控制原理復習——第一章緒論
