它们都是成本函数吗?在评估错误时,您会看到两者吗?或者它们是否真的是单独的措施?对于logloss错误感到困惑,并且很难找到有关它的信息。
答案 0 :(得分:1)
假设您已经在某些列车数据上训练了一些分类器, x tr ,y tr ,您已经获得了一些适合的分类器米。现在对于某些 x,y ,您可以获取分类器的结果ŷ=ŷ m (x)。
log loss是一个带 y 和ŷ的函数,并输出分类器对数据的处理效果。
< / LI>OOB (out of bag)只是意味着你不采取 x tr ,y tr ,用于训练的数据集,作为 x,y ,用于评估性能的数据集。相反,它意味着 x,y 是 x te ,y te ,你离开训练的一些数据集(可能是专门用于此目的)。
这两个概念是正交的,因此:
使用适合分类器和OOB数据集,您可以使用或不使用日志丢失。
您可以测量OOB数据集或原始列车数据集上的日志损失(在后一种情况下,您应该非常小心地解释结果 - 这是一个非常糟糕的估计预测器实际上有效。)