Davies-bouldin索引验证基本上是群集分散和群集距离之间的比率。我们对所有集群进行迭代,最后取maximum
。我的问题是为什么最大值不是最小值?
谢谢。
答案 0 :(得分:0)
考虑以下情况:
三个集群。一个与其他人分开,两个是混为一谈。
让所有人的S_i为0.5。
对于混合的,M_ij接近于零。对于分离良好的装置,装置的距离要大得多。结果R_i对于混合的R_i是大的,对于分离的簇是小的。
如果采用最大值,则索引显示"两个群集混淆,结果因此很糟糕 - 并非所有群集都分离良好"。如果你使用了最小值,那么它会忽略这个问题,然后说"好吧,至少它将它们从其他集群的一个中分离出来。#/ p>