您好我正在使用随机林分类器来产生恶意。日志错误包含= ve& -ve值。运行具有不同设置的分类器后。我能够获得大约0.8的训练测试分数,但测试分数总是负的。为什么会这样? 我应该使用abs(日志错误)进行预测还是我选择随机森林错误?
答案 0 :(得分:0)
随机森林的选择可能是错误的,但你最好在数据的上下文中检查它,就像你在这里共享数据一样,在确切的点上很容易帮助你。但是,如果您的总观察值在1000-2000左右,我建议您尝试使用Knn。
此外,如果您使用任何类型的编码将分类数据转换为标称数据,请仅使用一个热编码作为其他属性的添加值。
您应该检查属性与目标变量的相关性,因为测试数据中目标变量的低相关性可能会导致负分数。
除此之外,数据的分布在随机森林退化中起着至关重要的作用。因此,尝试检查分布并应用box-cox等方法来转换正态分布的数据。
答案 1 :(得分:-1)
我完全不明白你的问题。什么是“产品logerror”。什么是“包含= ve& -ve”。 还不清楚你的考试成绩是多少。但不知何故,你提到你使用日志。 因此,如果您的错误介于0和1之间,则您的日志(错误)将为负数。 对于error = 1,它将为0 和错误> 1这将是积极的