如何在随机森林中验证/估计OOB错误的准确性?

时间:2019-04-26 15:20:58

标签: random-forest

我可能不在这里的正确位置,但是我会去的。

我正在使用RF来估算我使用的仿真工具的结果。这是必需的,因为模拟的计算量很大。我正在尝试开发一种程序来优化预测变量空间(训练数据)中这些点的位置,以便为训练数据使用尽可能少的点,从而进行尽可能少的模拟。为此,我依靠Ranger(RF的C ++实现)随附的OOB错误估计。

我的问题是,我不知道我的数据集需要多大才能使OOB错误估计更加准确。我猜想某个地方一定有人曾尝试评估OOB错误估计的重要性/准确性,但我找不到它。

有人知道一些文献,博客文章,预编码方法可以帮助我实现这一目标吗?

0 个答案:

没有答案