我遵循此示例代码在我自己的数据集上使用RFE:
# ensure the results are repeatable
set.seed(7)
# load the library
library(mlbench)
library(caret)
# load the data
data(PimaIndiansDiabetes)
# define the control using a random forest selection function
control <- rfeControl(functions=rfFuncs, method="cv", number=10)
# run the RFE algorithm
results <- rfe(PimaIndiansDiabetes[,1:8], PimaIndiansDiabetes[,9], sizes=c(1:8), rfeControl=control)
# summarize the results
print(results)
# list the chosen features
predictors(results)
# plot the results
plot(results, type=c("g", "o"))
我可以根据需要让RFE部分工作,并根据需要进行所有绘图,但我不清楚如何使用此模型并使用它来预测新数据。我可以很容易地获得RFE结果的RMSE,但该指标仅来自训练模型;我现在需要将它应用于测试集,然后基于将RFE应用于测试集来获得结果的RMSE。
如果我对这个过程有误,请帮助我理解。
答案 0 :(得分:3)
PimaIndiansDiabetes_Test
(其中error CS0106: The modifier 'readonly' is not valid for this item
是您的测试集)