当我使用R执行k-means聚类数据时。我不知道如何找到合适的k值。我看到了弯头方法,但我不知道如何使用 kclus< - kmeans(data,centers = k); 任何人都可以帮我找到定义Elbow方法来找到k值吗?感谢
答案 0 :(得分:2)
我使用了这个特定示例,此处f
为mydata
library("clusters")
library("fpc")
findClusters <- function(f) {
asw <- numeric(20)
for (k in 2:20)
asw[[k]] <- pam(f,k)$silinfo$avg.width
k.best <- which.max(asw)
cl <- kmeans(f,k.best)
return(unlist(round(cl$centers,3),recursive = FALSE))
}
我从这个特定的link
中取得了这个答案 1 :(得分:1)
您可以使用Elbow方法作为以下代码段:
elbow.k <- function(mydata){
## determine a "good" k using elbow
dist.obj <- dist(mydata);
hclust.obj <- hclust(dist.obj);
css.obj <- css.hclust(dist.obj,hclust.obj);
elbow.obj <- elbow.batch(css.obj);
# print(elbow.obj)
k <- elbow.obj$k
return(k)
}
它可以找到合适的k值。但是耗时,你应该使用并行包来减少时间。