我正在尝试使用 R 中随机森林的 h2o 实现进行特征选择,但我正在处理这个问题:我有三个特征可以“捕捉”所有的重要性。这是我的情况:
//@version=4
study(title="Donchian Channels", shorttitle="DC", overlay=true)
length = input(20, minval=1)
lower = lowest(length)
upper = highest(length)
basis = avg(upper, lower)
u = security(syminfo.tickerid, "240", upper)
l = security(syminfo.tickerid, "240", lower)
plot(u)
plot(l)
但我不想为了不过度拟合测试集而丢弃所有其他变量。我试图删除三个最重要的变量,以便让算法向其他变量学习。这是个好主意吗?