我正在使用PAM中的R进行聚类分析。我使用vegdist()计算了数据的gower距离,并且使用pam()计算集群变量效果很好。现在我需要一个措施来确定正确的k。我知道的方法是在视觉上比较不同ks的平方和。如何从一系列PAM迭代中获取WSS以比较绘图中的总和,类似于此示例中的kmeans? http://rstudio-pubs-static.s3.amazonaws.com/137758_a80b40255fdd440ab76b41a646a6c482.html#loops
答案 0 :(得分:1)
PAM不会优化WSS。 WSS是k-means目标。
相反,使用PAM目标(可能在文献中称为TD?)
有关?[pam.object][1]
字段的信息,请参见objective
:
objective
pam算法第一步和第二步之后的目标函数。
请注意,与WSS类似,objective
应该随着k的增加而减少。因此,你不能只选择最小值,但你应该在情节中找一个膝盖。
由于PAM是随机的,您可能希望多次运行每个k,并且只保留最佳结果。