在R中的PAM聚类分析中计算平方和

时间:2016-07-11 11:52:23

标签: r cluster-analysis pam

我正在使用PAM中的R进行聚类分析。我使用vegdist()计算了数据的gower距离,并且使用pam()计算集群变量效果很好。现在我需要一个措施来确定正确的k。我知道的方法是在视觉上比较不同ks的平方和。如何从一系列PAM迭代中获取WSS以比较绘图中的总和,类似于此示例中的kmeans? http://rstudio-pubs-static.s3.amazonaws.com/137758_a80b40255fdd440ab76b41a646a6c482.html#loops

1 个答案:

答案 0 :(得分:1)

PAM不会优化WSS。 WSS是k-means目标。

相反,使用PAM目标(可能在文献中称为TD?)

有关?[pam.object][1]字段的信息,请参见objective

  

objective

     
    

pam算法第一步和第二步之后的目标函数。

  

请注意,与WSS类似,objective应该随着k的增加而减少。因此,你不能只选择最小值,但你应该在情节中找一个膝盖。

由于PAM是随机的,您可能希望多次运行每个k,并且只保留最佳结果。