如何识别R

时间:2016-07-01 10:26:01

标签: r machine-learning

我使用R来构建和比较几种预测模型。由于我使用的测试集不是"大",我想去查看哪些实例被哪种模型错误分类。

进一步解释自己的一个例子。以下R代码构建并测试用于预测猫Sex的模型:

library(e1071)
library(MASS)
data(cats)

index <- 1:nrow(cats)
testindex <- sample(index, trunc(length(index)/3))
testset <- cats[testindex,]
trainset <- cats[-testindex,]

model <- svm(Sex~., data = trainset)
prediction <- predict(model, testset[,-1])

tab <- table(pred = prediction, true = testset[,1])

print(tab)

代码生成下表:

    true
pred  F  M
   F 11  3
   M  8 26

我如何准确知道实际为F但被错误归类为M的8个实例?同样,对于实际为M但被错误归类为F的3个实例? 更具体地说,cats数据集包含144个条目:知道每个错误分类的实例的行是我正在寻找的。

1 个答案:

答案 0 :(得分:1)

which(prediction != testset[,1]) 

会为您提供错误分类的testset行。