我正在学习如何在r中使用决策树。
我做了一个模型并做了一个预测。我想检查模型的准确性。但是,当我尝试使用表函数制作混淆矩阵时,我得到的错误是:
表中的错误(test_data $ Outcome,预测):所有参数必须 长度相同
我使用的代码是:
data = read.csv("C:/Users/VIJAY/Desktop/ML/logistic regression/diabetes.csv")
head(data)
dim(data)
library(rpart)
library(rpart.plot)
library(caret)
s = sample(768,600)
train_data = data[s,]
test_data = data[-s,]
model = rpart(Outcome ~.,data = train_data, method = "class")
rpart.plot(model,cex = .9)
predictn = predict(model,data= test_data,type = "class")
tab = table(test_data$Outcome,predictn)
答案 0 :(得分:2)
您对测试集和预测的响应长度不同。我会说并不是所有观察都做出了预测(可能是由于某些预测变量的值缺失-为此,请考虑使用替代变量或删除测试集中这些预测变量中具有缺失值的行)。
顺便说一句,当您使用插入符号时,有一个很好的函数插入符号:: confusionMatrix()