如何计算Weka中集群评估的准确性

时间:2015-03-17 15:45:36

标签: machine-learning weka data-mining evaluation unsupervised-learning

我们如何使用Weka计算群集的准确度?

我可以使用这个公式:

Accuracy (A) = (tp+tn)/Total # samples

但我如何知道Weka工具实验输出中的真正积极,假阳性,真阴性和假阴性是什么?

3 个答案:

答案 0 :(得分:0)

Weka中有一些不同的聚类模式:

使用训练集(默认):在群集之后,Weka将训练实例分类为它开发的群集,并计算落入每个群集的实例百分比。例如,集群0中的X%和集群1中的Y%等

提供的测试集:如果群集表示与EM算法一样具有概率性,Weka可以在单独的测试数据上评估群集。

使用类进行群集评估:在此模式下,Weka首先忽略class属性并生成群集。在测试期间,它根据每个集群中类属性的多数值为集群分配类标签。最后,它计算分类错误并显示相应的混淆矩阵。

答案 1 :(得分:0)

查看cross-validation原则。在java代码中使用ClusterEvaluation的方法crossValidateModel和evaluateClusterer。或者您也可以直接使用weka GUI进行实验。

答案 2 :(得分:0)

根据this对类似问题的回答,可以通过软件包管理器下载的classificationViaClustering元分类器将完成您想要的工作。