假设我有一个具有n个级别的因子变量y
,我可以获得预测和实际结果。如何构建混淆矩阵?
set.seed(12345)
y_actual = as.factor(sample(c('A','B', 'C', 'D', 'E'), 100, replace = TRUE))
set.seed(12346)
y_predict = as.factor(sample(c('A','B', 'C', 'D', 'E'), 100, replace = TRUE))
对于n = 2的情况,已经回答了这个问题。参见
R: how to make a confusion matrix for a predictive model?
我尝试了什么
这是我走了多远
ones = data.frame(total = rep(1,100));
confusion = aggregate(ones, list(Prediction = predict, Reality = real), sum, a.action=0)
confusion
Prediction Reality total
1 A A 12
2 B A 5
3 C A 15
4 A B 15
5 B B 7
6 C B 8
7 A C 12
8 B C 16
9 C C 10
现在必须以矩阵的形式出现。
背景
混淆矩阵具有水平标签“实际类”和垂直标签“预测类”。矩阵元素就像这样计算:
element(1,1)=实际类的计数数为A,预测类为A
element(1,2)=实际类的计数数为A,预测类为B
等
答案 0 :(得分:8)
只需使用包中的confusionMatrix
require(caret)
confusionMatrix(y_actual, y_predict)
Reference
Prediction A B C
A 12 5 15
B 15 7 8
C 12 16 10
答案 1 :(得分:7)
您应该可以使用table
:
table(y_actual, y_predict)
# y_predict
# y_actual A B C D E
# A 4 3 4 2 8
# B 7 1 3 6 2
# C 3 7 1 0 4
# D 3 6 6 4 6
# E 6 5 5 1 3