有没有人知道我可以用来计算两列列表中误报百分比的算法。
以我的情况为例。我有一个聚类向量显示一个聚类所属的组,并且我在另一列的旁边有正确的标签。我知道有些分类是错误的,因为它们没有映射到最常出现的标签。如何查找所有标签的误报百分比。我在R。
中实现这一点Cluster_vector | Labels
1 5
3 5
1 5
1 5
6 5
答案 0 :(得分:1)
您是否只是在寻找不匹配的比例,例如mean(x[,1] != x[,2])
?
您可以通过table(x[,1] != x[,2])/nrow(x)
获取混淆矩阵。