随机森林的负面测试分数

时间:2017-09-28 20:18:37

标签: python-2.7 machine-learning random-forest

您好我正在使用随机林分类器来产生恶意。日志错误包含= ve& -ve值。运行具有不同设置的分类器后。我能够获得大约0.8的训练测试分数,但测试分数总是负的。为什么会这样? 我应该使用abs(日志错误)进行预测还是我选择随机森林错误?

2 个答案:

答案 0 :(得分:0)

随机森林的选择可能是错误的,但你最好在数据的上下文中检查它,就像你在这里共享数据一样,在确切的点上很容易帮助你。但是,如果您的总观察值在1000-2000左右,我建议您尝试使用Knn。

此外,如果您使用任何类型的编码将分类数据转换为标称数据,请仅使用一个热编码作为其他属性的添加值。

您应该检查属性与目标变量的相关性,因为测试数据中目标变量的低相关性可能会导致负分数。

除此之外,数据的分布在随机森林退化中起着至关重要的作用。因此,尝试检查分布并应用box-cox等方法来转换正态分布的数据。

答案 1 :(得分:-1)

我完全不明白你的问题。什么是“产品logerror”。什么是“包含= ve& -ve”。 还不清楚你的考试成绩是多少。但不知何故,你提到你使用日志。 因此,如果您的错误介于0和1之间,则您的日志(错误)将为负数。 对于error = 1,它将为0 和错误> 1这将是积极的