我已经使用Weka对一组文本文档进行了聚类。它将类似的文档分组到一个聚类中。我想测量文本文档在聚类中如何彼此接近。如何计算文档中的文档之间的距离群集。
任何人都可以帮助我。我是数据挖掘的新用户。
答案 0 :(得分:0)
这是我的simpleKmeans聚类算法代码:
EuclideanDistance Dist = weka.core.EuclideanDistance();
Double distance = Dist.distance(clusterCentroid.instance(clusterNumber), Data.instance(instaceIndex));
注意:此距离已标准化