我们如何使用Weka计算群集的准确度?
我可以使用这个公式:
Accuracy (A) = (tp+tn)/Total # samples
但我如何知道Weka工具实验输出中的真正积极,假阳性,真阴性和假阴性是什么?
答案 0 :(得分:0)
Weka中有一些不同的聚类模式:
使用训练集(默认):在群集之后,Weka将训练实例分类为它开发的群集,并计算落入每个群集的实例百分比。例如,集群0中的X%和集群1中的Y%等
提供的测试集:如果群集表示与EM算法一样具有概率性,Weka可以在单独的测试数据上评估群集。
使用类进行群集评估:在此模式下,Weka首先忽略class属性并生成群集。在测试期间,它根据每个集群中类属性的多数值为集群分配类标签。最后,它计算分类错误并显示相应的混淆矩阵。
答案 1 :(得分:0)
查看cross-validation原则。在java代码中使用ClusterEvaluation的方法crossValidateModel和evaluateClusterer。或者您也可以直接使用weka GUI进行实验。
答案 2 :(得分:0)
根据this对类似问题的回答,可以通过软件包管理器下载的classificationViaClustering
元分类器将完成您想要的工作。