如果k = 1,则HAC的轮廓系数

时间:2018-06-20 13:23:51

标签: python-2.7 cluster-analysis evaluation hierarchical-clustering silhouette

如果k=1,那么如何计算HAC聚类的Silhouette系数值(因此,一个聚类中的所有数据)?轮廓系数的范围为-11,但是对于单例(k=maximum)(仅包含1个数据的群集),轮廓系数为0。是0的轮廓系数是k=1还是-11?轮廓系数的公式为 here

SC(i) = (b(i)-a(i))/max(a(i), b(i))

a(i) = Average distance of object with other object in one cluster.

b(i) = Minimum Average distance of object with other object in other cluster.

*对不起我的英语不好

1 个答案:

答案 0 :(得分:0)

仅针对单个群集,未定义轮廓系数

所以正确的值是不确定的,尽管我建议那时使用0。因为0是作者为一元素群集建议的值,所以Silhouette值也将是未定义的。

负轮廓的概念是这些点更靠近另一个群集。对于一个群集解决方案,这不成立。该值应为0。或未定义。