使用XGBoost R

时间:2017-07-13 10:33:21

标签: r r-caret xgboost feature-selection

我在R中创建了一个预测模型。我想做特征选择。我已经读过xgboost使得不必进行变量选择,但我为过去的1,2,3,4和5分增加了一个变量。添加每个变量使这些RMSE重复5次交叉验证。

10.3 10.1 10 10.1 10.5

这表明由于错误率创建的U模式,变量选择确实有所不同。

我正在考虑迭代所有新变量但听起来效率低下。有没有更好的方法呢?

我还在考虑逐步回归并使用这些功能。这是个好主意吗?

1 个答案:

答案 0 :(得分:0)

您可以尝试根据要素重要性得分执行要素选择,仅保留其重要性超过给定阈值的要素(比如平均要素重要性)并尝试查看是否可以改善RMSE