我使用app在训练数据(称为df)上训练了RF模型。 60个变量。我需要相应地对新数据进行分类。但是,我的新数据有应用程序。 400个变量(称为fut)。
在尝试对新数据进行分类时,我收到以下错误,需要删除训练数据中未显示的所有列(在新数据中)来“清理”我的新数据。
Error in predict.randomForest(rfModel, fut, type = "prob") :
New factor levels not present in the training data
我尝试了以下方法:
fut[names(df)]
fut[c(names(df))]
subset(fut, select = names(df))
这似乎是每个人在部署分类算法时都会遇到的问题,因此令我惊讶的是,没有明显的代码行可以完成此任务。