应用错误收集

好吧，我一直在研究用于聚类的不同算法，如k-means，k-mediods等，我试图在这里运行算法并分析它们在叶子数据集上的表现： http://archive.ics.uci.edu/ml/datasets/Leaf

通过首先读取csv文件，过滤掉不需要的属性并在其上应用k-means，我能够通过k-means聚类数据集。我在这里面临的问题是，我希望计算通过k-means开发的模型的熵，精度，召回和f-度量等度量。是否有一个允许我这样做的操作员，以便我可以定量比较快速采矿者可用的不同聚类算法？

P.S我知道像性能（分类）这样的性能操作符，它允许我计算模型的精度和召回率，但我不知道任何允许我计算熵的算法。

非常感谢帮助。