我使用table
显示kmeans
群集的结果与实际的类值。
如何根据该表计算%准确度。我知道如何手动完成。
Iris-setosa在群集2中有50个,而Iris-versicolor在另一个群集中有两个。
有没有办法计算像Incorrectly classified instances: 52%
我想按类和集群打印混淆矩阵。有点像这样:
0 1 <-- assigned to cluster
380 120 | 1
135 133 | 0
Cluster 0 <-- 1
Cluster 1 <-- 0
Incorrectly clustered instances : 255.0 33.2031 %
答案 0 :(得分:4)
您可以使用diag()
选择对角线上的案例,并使用它来计算(in)准确度,如下所示:
sum(diag(d))/sum(d) #overall accuracy
1-sum(diag(d))/sum(d) #incorrect classification
您还可以使用它来计算正确分类的案例数量(
)sum(diag(d)) #N cases correctly classified
sum(d)-sum(diag(d)) #N cases incorrectly classified
其中 d
是您的混淆矩阵