如果k=1
,那么如何计算HAC聚类的Silhouette系数值(因此,一个聚类中的所有数据)?轮廓系数的范围为-1
到1
,但是对于单例(k=maximum
)(仅包含1个数据的群集),轮廓系数为0
。是0
的轮廓系数是k=1
还是-1
或1
?轮廓系数的公式为
here。
SC(i) = (b(i)-a(i))/max(a(i), b(i))
a(i) = Average distance of object with other object in one cluster.
b(i) = Minimum Average distance of object with other object in other cluster.
*对不起我的英语不好
答案 0 :(得分:0)
仅针对单个群集,未定义轮廓系数。
所以正确的值是不确定的,尽管我建议那时使用0。因为0是作者为一元素群集建议的值,所以Silhouette值也将是未定义的。
负轮廓的概念是这些点更靠近另一个群集。对于一个群集解决方案,这不成立。该值应为0。或未定义。