插入符号决策树预测问题

时间:2015-08-19 21:42:36

标签: prediction r-caret rpart

我在使用决策树(CART)进行预测时遇到问题。

我有这段代码:

training <- read.csv("pml-training.csv", header=TRUE)
set.seed(1972)
inTrain <- createDataPartition(y=training2$classe, p=0.6, list=FALSE)
wk_training <- training2[inTrain,]
wk_testing <- training2[-inTrain,]

wk_trainng数据集有11776个变量和wk_testing 7846。

set.seed(1972)
model_dt <- train(wk_training$classe ~ ., data = wk_training,  method="rpart")
print(model_dt, digits=3)

针对wk_testing

运行
predictions_dt <- predict(model_dt, newdata=wk_testing)

然后我希望predictions_dt有7846行,因为它有wk_testing, 但是predictions_dt只有165行????

我不知道我做错了什么......

有人能帮助我吗?

提前致谢

1 个答案:

答案 0 :(得分:0)

如果您缺少值,则predict函数默认为na.action = na.omit。您可以使用na.action = na.fail进行测试以查看是否存在此问题。如果是这种情况,您可能想要归咎于此。请参阅preProcess中的train选项。