我在使用决策树(CART)进行预测时遇到问题。
我有这段代码:
training <- read.csv("pml-training.csv", header=TRUE)
set.seed(1972)
inTrain <- createDataPartition(y=training2$classe, p=0.6, list=FALSE)
wk_training <- training2[inTrain,]
wk_testing <- training2[-inTrain,]
wk_trainng数据集有11776个变量和wk_testing 7846。
set.seed(1972)
model_dt <- train(wk_training$classe ~ ., data = wk_training, method="rpart")
print(model_dt, digits=3)
针对wk_testing
运行predictions_dt <- predict(model_dt, newdata=wk_testing)
然后我希望predictions_dt有7846行,因为它有wk_testing, 但是predictions_dt只有165行????
我不知道我做错了什么......
有人能帮助我吗?
提前致谢
答案 0 :(得分:0)
如果您缺少值,则predict
函数默认为na.action = na.omit
。您可以使用na.action = na.fail
进行测试以查看是否存在此问题。如果是这种情况,您可能想要归咎于此。请参阅preProcess
中的train
选项。