处理随机森林过度拟合

时间:2018-03-26 17:20:10

标签: machine-learning random-forest

我正在尝试处理随机森林中的过度拟合问题。我试图减少过度拟合的参数是max_depth,min_samples_leaf,min_samples_split。列车集有2000个样本,验证集有500个。我试图将min_samples_leaf和min_samples_split设置为10到50,甚至将max_depth设置为1.问题仍然存在。对于像max_features和n_estimators这样的参数,我认为它们已经足够,并且对过度拟合没有太大的影响。在这种情况下,我还能做些什么来减少过度拟合? (顺便说一下,训练集上的AUC分数是0.73,验证集是0.53所以我认为这是过度拟合的)

我真诚地感谢任何帮助!

0 个答案:

没有答案