与Random Forests相关,OOB和Logloss错误有什么区别?

时间:2016-03-25 14:23:33

标签: machine-learning random-forest

它们都是成本函数吗?在评估错误时,您会看到两者吗?或者它们是否真的是单独的措施?对于logloss错误感到困惑,并且很难找到有关它的信息。

1 个答案:

答案 0 :(得分:1)

假设您已经在某些列车数据上训练了一些分类器, x tr ,y tr ,您已经获得了一些适合的分类器。现在对于某些 x,y ,您可以获取分类器的结果ŷ=ŷ m (x)

  • log loss是一个带 y ŷ的函数,并输出分类器对数据的处理效果。

    < / LI>
  • OOB (out of bag)只是意味着你采取 x tr ,y tr ,用于训练的数据集,作为 x,y ,用于评估性能的数据集。相反,它意味着 x,y x te ,y te ,你离开训练的一些数据集(可能是专门用于此目的)。

这两个概念是正交的,因此:

  • 使用适合分类器和OOB数据集,您可以使用或不使用日志丢失。

  • 您可以测量OOB数据集或原始列车数据集上的日志损失(在后一种情况下,您应该非常小心地解释结果 - 这是一个非常糟糕的估计预测器实际上有效。)