应用错误收集

在R中的PAM聚类分析中计算平方和

时间：2016-07-11 11:52:23

标签： r cluster-analysis pam

我正在使用PAM中的R进行聚类分析。我使用vegdist（）计算了数据的gower距离，并且使用pam（）计算集群变量效果很好。现在我需要一个措施来确定正确的k。我知道的方法是在视觉上比较不同ks的平方和。如何从一系列PAM迭代中获取WSS以比较绘图中的总和，类似于此示例中的kmeans？ http://rstudio-pubs-static.s3.amazonaws.com/137758_a80b40255fdd440ab76b41a646a6c482.html#loops

1 个答案:

答案 0 :(得分：1)

PAM不会优化WSS。 WSS是k-means目标。

相反，使用PAM目标（可能在文献中称为TD？）

有关?[pam.object][1]字段的信息，请参见objective：

objective


pam算法第一步和第二步之后的目标函数。

请注意，与WSS类似，objective应该随着k的增加而减少。因此，你不能只选择最小值，但你应该在情节中找一个膝盖。

由于PAM是随机的，您可能希望多次运行每个k，并且只保留最佳结果。