Scree Plot用于确定K均值中的K.

时间:2015-11-17 08:52:32

标签: r cluster-analysis k-means

我正在学习R并且在进行K Means聚类时,我多次遇到以下函数来确定scree图中的最佳K. 现在,我确实理解了函数背后的逻辑,但是我很难理解R函数,有人可以解释一下。

wssplot <- function(data, nc=15, seed=1234)
  {
    wss <- (nrow(data)-1)*sum(apply(data,2,var))
    for (i in 2:nc)
    {
      set.seed(seed)
      wss[i] <- sum(kmeans(data, centers=i)$withinss)
    }
    plot(1:nc, wss, type="b", xlab="Number of Clusters",
    ylab="Within groups sum of squares")
}

1 个答案:

答案 0 :(得分:0)

该函数运行kmeans nc-1次,找到它总和的平方和矢量。这是每次迭代的结果,它们依次绘制在图表上,其中x轴上有簇数,y轴表示平方和之和。