我正在学习Weka的聚类并试图获得"错误地聚集的实例"在' ClusterEvaluation'之后使用python-weka-wrapper 0.3.8(python 2.7)。
目前,我在输入arff文件中有class属性,成功构建数据模型,并且可以得到num of clusters& cluster_assignments&训练集中每个集群的集群实例......等等(都遵循python-weka-wrapper-examples / src / wekaexamples / clusterers / clusterers.py的例子)
但是,我想知道每个实例是否正确聚类为输入arff的标记类,以及错误聚簇实例的比例(就像Weka GUI的输出结果一样)。
在运行weka.clusterers.ClusterEvaluation模块之前,我不确定从Weka GUI v3.8.0 / Explore / Cluster / Cluster模式/ Classes到Clusters评估中的this选项的设置位置。
有没有人知道如何通过python-weka-wrapper来做mapClasses(http://weka.sourceforge.net/doc.stable/weka/clusterers/ClusterEvaluation.html#mapClasses-int-int-int:A:A-int:A-double:A-double:A-int-)?或者无论如何得到聚集实例的比率结果v.s标记的类属性?
欣赏!
答案 0 :(得分:0)
如果使用Instances
类执行集群评估时,ClusterEvaluation
测试对象设置了类属性,则可以使用classes_to_clusters
属性获取已收集的映射在评估群集器时。等效的Java方法是ClusterEvaluation.getClassesToClusters。
mapClasses
方法没有作为Python函数公开。