我想计算这个示例方案的熵
http://nlp.stanford.edu/IR-book/html/htmledition/evaluation-of-clustering-1.html
熵方程
然后熵是(第一行)
因此熵适用于此方案
For the first cluster - ( (5/6)*Log(5/6) + (1/6)*Log(1/6) )
For the second cluster - ( (1/6)*Log(1/6) + (1/6)*Log(1/6) + (4/6)*Log(4/6) )
For the third cluster - ( (2/5)*Log(2/5) + (3/5)*Log(3/5) )
最终熵是:
FirtCluster_Entropy + SecondCluster_Entropy + ThirdCluster_Entropy
我是对的吗?
答案 0 :(得分:1)
非常接近!对于聚类的总熵,您需要通过其相对权重对每个聚类的熵进行加权。请参阅我之前问题的答案https://stackoverflow.com/a/35780505/159646。
此外,这应该发布到Cross Validated而不是Stack Overflow。