我正在研究随机森林,我收集了一些数据。我测试了我的分类器,并且在我的测试集上获得了大约89%的准确度。然而,当我将数据缩放到零均值和单位方差时,我的准确率下降了近50%。我发现了this帖子,这似乎暗示我不需要扩展数据以获得最佳效果。
是否有人可以说明导致准确度大幅下降的可能原因是什么?
编辑:我正在使用sklearn.ensemble
进行随机林实施
此处有一个link数据
答案 0 :(得分:0)
对于输入要素的某些转换,随机林是否不变取决于您的错误功能。简而言之,当您的功能在移位和缩放下不变时,您的模型也是如此。
在浏览帮助页面here之后,似乎使用的标准功能似乎是偏差损失。这个函数在输入特征的缩放下不是不变的,这可以解释你的观察结果。