随机森林的预测性能:在没有置换变量的情况下置换或运行模型之间是否存在差异?

时间:2016-01-22 14:57:01

标签: r performance random-forest

我正在使用R包“ModelMap”来生成随机森林(RF)模型(回归模型)。它提供了一个曲线,显示了输入变量的相对重要性,通过测量输入变量xy模型在输入变量xy的整体精度的%之后的减少=消除其预测能力。另一个图显示模型的RMSE,基于使用测试数据的模型验证(预测值与观测值)。

现在让我们生成另一个RF模型,不包括上面提到的输入变量xy,让我们将RMSE与第一个模型的RMSE进行比较。结果几乎为0 (单位为每300公斤/公顷),尽管先前模型的MSE下降显示变量xy下降70%并且应该导致性能下降排除它。

这种方法有意义吗?如果是,为什么第二个模型具有相同的预测性能?

感谢您的帮助

0 个答案:

没有答案