我在R中创建了一个预测模型。我想做特征选择。我已经读过xgboost使得不必进行变量选择,但我为过去的1,2,3,4和5分增加了一个变量。添加每个变量使这些RMSE重复5次交叉验证。
10.3 10.1 10 10.1 10.5
这表明由于错误率创建的U模式,变量选择确实有所不同。
我正在考虑迭代所有新变量但听起来效率低下。有没有更好的方法呢?
我还在考虑逐步回归并使用这些功能。这是个好主意吗?
答案 0 :(得分:0)
您可以尝试根据要素重要性得分执行要素选择,仅保留其重要性超过给定阈值的要素(比如平均要素重要性)并尝试查看是否可以改善RMSE