我使用R来构建和比较几种预测模型。由于我使用的测试集不是"大",我想去查看哪些实例被哪种模型错误分类。
进一步解释自己的一个例子。以下R代码构建并测试用于预测猫Sex
的模型:
library(e1071)
library(MASS)
data(cats)
index <- 1:nrow(cats)
testindex <- sample(index, trunc(length(index)/3))
testset <- cats[testindex,]
trainset <- cats[-testindex,]
model <- svm(Sex~., data = trainset)
prediction <- predict(model, testset[,-1])
tab <- table(pred = prediction, true = testset[,1])
print(tab)
代码生成下表:
true
pred F M
F 11 3
M 8 26
我如何准确知道实际为F
但被错误归类为M
的8个实例?同样,对于实际为M
但被错误归类为F
的3个实例?
更具体地说,cats
数据集包含144个条目:知道每个错误分类的实例的行是我正在寻找的。 p>
答案 0 :(得分:1)
which(prediction != testset[,1])
会为您提供错误分类的testset
行。