用另一个data.frame的列名子集一个data.frame(在R中)

时间:2019-03-15 22:43:22

标签: r dataframe data-cleaning

我使用app在训练数据(称为df)上训练了RF模型。 60个变量。我需要相应地对新数据进行分类。但是,我的新数据有应用程序。 400个变量(称为fut)。

在尝试对新数据进行分类时,我收到以下错误,需要删除训练数据中未显示的所有列(在新数据中)来“清理”我的新数据。

Error in predict.randomForest(rfModel, fut, type = "prob") : 
  New factor levels not present in the training data

我尝试了以下方法:

fut[names(df)]
fut[c(names(df))]
subset(fut, select = names(df))

这似乎是每个人在部署分类算法时都会遇到的问题,因此令我惊讶的是,没有明显的代码行可以完成此任务。

0 个答案:

没有答案