如何在ClusterEvaluation之后通过最新的weka-python-wrapper 0.3.8获取错误聚簇的实例?

时间:2016-10-02 14:50:29

标签: python weka

我正在学习Weka的聚类并试图获得"错误地聚集的实例"在' ClusterEvaluation'之后使用python-weka-wrapper 0.3.8(python 2.7)。

目前,我在输入arff文件中有class属性,成功构建数据模型,并且可以得到num of clusters& cluster_assignments&训练集中每个集群的集群实例......等等(都遵循python-weka-wrapper-examples / src / wekaexamples / clusterers / clusterers.py的例子)

但是,我想知道每个实例是否正确聚类为输入arff的标记类,以及错误聚簇实例的比例(就像Weka GUI的输出结果一样)。

在运行weka.clusterers.ClusterEvaluation模块之前,我不确定从Weka GUI v3.8.0 / Explore / Cluster / Cluster模式/ Classes到Clusters评估中的this选项的设置位置。

有没有人知道如何通过python-weka-wrapper来做mapClasses(http://weka.sourceforge.net/doc.stable/weka/clusterers/ClusterEvaluation.html#mapClasses-int-int-int:A:A-int:A-double:A-double:A-int-)?或者无论如何得到聚集实例的比率结果v.s标记的类属性?

欣赏!

1 个答案:

答案 0 :(得分:0)

如果使用Instances类执行集群评估时,ClusterEvaluation测试对象设置了类属性,则可以使用classes_to_clusters属性获取已收集的映射在评估群集器时。等效的Java方法是ClusterEvaluation.getClassesToClustersmapClasses方法没有作为Python函数公开。