多级模型的准确性,精确度和召回率

时间:2015-10-12 12:55:45

标签: r naivebayes confusion-matrix precision-recall

如何从Naive Bayes模型计算每个类的准确度精度召回? 我正在使用嵌入式数据集:iris和package tree ,并将 e1071 打包为Naive Bayes。混淆矩阵如下:

prediction   setosa versicolor virginica
setosa         29          0         0
versicolor      0         20         2
virginica       0          3        21

P.S:请注意,我使用75个条目作为训练集,其他用于测试:

iris.train <- c(sample(1:150, 75)) # have selected 75 randomly

1 个答案:

答案 0 :(得分:22)

在整个答案中,(accuracy <- sum(diag(mat)) / sum(mat)) # [1] 0.9333333 是您描述的混淆矩阵。

您可以使用以下方式计算和存储准确度:

(precision <- diag(mat) / rowSums(mat))
#     setosa versicolor  virginica 
#  1.0000000  0.9090909  0.8750000 

每个类的精度(假设预测在行上,真实结果在列上)可以用以下公式计算:

(precision.versicolor <- precision["versicolor"])
# versicolor 
#  0.9090909 

如果你想获取特定类的精度,你可以这样做:

recall <- (diag(mat) / colSums(mat))
#     setosa versicolor  virginica 
#  1.0000000  0.8695652  0.9130435 

召回每个类(再次假设预测在行上,真实结果在列上)可以用以下方法计算:

(recall.virginica <- recall["virginica"])
# virginica 
# 0.9130435 

如果您想要回忆特定课程,您可以执行以下操作:

(mat = as.matrix(read.table(text="  setosa versicolor virginica
 setosa         29          0         0
 versicolor      0         20         2
 virginica       0          3        21", header=T)))
#            setosa versicolor virginica
# setosa         29          0         0
# versicolor      0         20         2
# virginica       0          3        21

如果您将真实结果作为行和预测结果作为列,那么您将翻转精度并调用定义。

数据:

Driver={Microsoft Access Driver (*.mdb)}