如何计算聚类熵 - 示例和我给出的解决方案,但它是否正确?

时间:2016-03-03 00:06:04

标签: algorithm math cluster-analysis hierarchical-clustering entropy

我想计算这个示例方案的熵

http://nlp.stanford.edu/IR-book/html/htmledition/evaluation-of-clustering-1.html

enter image description here

熵方程

然后熵是(第一行)

enter image description here

因此熵适用于此方案

For the first cluster - ( (5/6)*Log(5/6) + (1/6)*Log(1/6) ) 
For the second cluster  - ( (1/6)*Log(1/6) + (1/6)*Log(1/6) + (4/6)*Log(4/6) )
For the third cluster  - ( (2/5)*Log(2/5) + (3/5)*Log(3/5) )

最终熵是:

 FirtCluster_Entropy + SecondCluster_Entropy  + ThirdCluster_Entropy  

我是对的吗?

1 个答案:

答案 0 :(得分:1)

非常接近!对于聚类的总熵,您需要通过其相对权重对每个聚类的熵进行加权。请参阅我之前问题的答案https://stackoverflow.com/a/35780505/159646

此外,这应该发布到Cross Validated而不是Stack Overflow。