应用错误收集

时间：2017-09-28 20:18:37

标签： python-2.7 machine-learning random-forest

您好我正在使用随机林分类器来产生恶意。日志错误包含= ve＆amp; -ve值。运行具有不同设置的分类器后。我能够获得大约0.8的训练测试分数，但测试分数总是负的。为什么会这样？我应该使用abs（日志错误）进行预测还是我选择随机森林错误？

答案 0 :(得分：0)

随机森林的选择可能是错误的，但你最好在数据的上下文中检查它，就像你在这里共享数据一样，在确切的点上很容易帮助你。但是，如果您的总观察值在1000-2000左右，我建议您尝试使用Knn。

此外，如果您使用任何类型的编码将分类数据转换为标称数据，请仅使用一个热编码作为其他属性的添加值。

您应该检查属性与目标变量的相关性，因为测试数据中目标变量的低相关性可能会导致负分数。

除此之外，数据的分布在随机森林退化中起着至关重要的作用。因此，尝试检查分布并应用box-cox等方法来转换正态分布的数据。

答案 1 :(得分：-1)

我完全不明白你的问题。什么是“产品logerror”。什么是“包含= ve＆amp; -ve”。还不清楚你的考试成绩是多少。但不知何故，你提到你使用日志。因此，如果您的错误介于0和1之间，则您的日志（错误）将为负数。对于error = 1，它将为0 和错误＆gt; 1这将是积极的