如何使用Elbow方法选择合适的k簇?

时间:2016-06-13 14:51:19

标签: r

当我使用R执行k-means聚类数据时。我不知道如何找到合适的k值。我看到了弯头方法,但我不知道如何使用 kclus< - kmeans(data,centers = k); 任何人都可以帮我找到定义Elbow方法来找到k值吗?感谢

2 个答案:

答案 0 :(得分:2)

我使用了这个特定示例,此处fmydata

library("clusters")
library("fpc")
findClusters <- function(f) {
    asw <- numeric(20)
    for (k in 2:20)
      asw[[k]] <- pam(f,k)$silinfo$avg.width

    k.best <- which.max(asw)
    cl <- kmeans(f,k.best)
    return(unlist(round(cl$centers,3),recursive = FALSE))
}

我从这个特定的link

中取得了这个

答案 1 :(得分:1)

您可以使用Elbow方法作为以下代码段:

elbow.k <- function(mydata){
  ## determine a "good" k using elbow
  dist.obj <- dist(mydata);
  hclust.obj <- hclust(dist.obj);
  css.obj <- css.hclust(dist.obj,hclust.obj);
  elbow.obj <- elbow.batch(css.obj);
  #   print(elbow.obj)
  k <- elbow.obj$k
  return(k)
}

它可以找到合适的k值。但是耗时,你应该使用并行包来减少时间。