随机森林特征选择

时间:2021-05-27 13:50:36

标签: r random-forest h2o feature-selection

我正在尝试使用 R 中随机森林的 h2o 实现进行特征选择,但我正在处理这个问题:我有三个特征可以“捕捉”所有的重要性。这是我的情况:

//@version=4
study(title="Donchian Channels", shorttitle="DC", overlay=true)
length = input(20, minval=1)
lower = lowest(length)
upper = highest(length)
basis = avg(upper, lower)

u = security(syminfo.tickerid, "240", upper)
l = security(syminfo.tickerid, "240", lower)

plot(u)
plot(l)

但我不想为了不过度拟合测试集而丢弃所有其他变量。我试图删除三个最重要的变量,以便让算法向其他变量学习。这是个好主意吗?

0 个答案:

没有答案