应用错误收集

如果您有非常多的输出标签（类），ECT和Filter树是有用的（仅限），假设N = 1000。使用OAA（一对一），它意味着为每个示例（在训练和测试期间）执行N个二进制分类任务。使用ECT，您可以更快地进行预测：log（N）。您可以将过滤树（它是ECT的基础）想象为决策树，在每个节点中，您询问该示例是属于一组标签还是另一组标签（使用所有要素，与原始决策树不同）。 / p>

一般而言，ECT比OAA更差（在损失或准确性方面）（但在某些情况下，它可能几乎与OAA一样好）。如果N = 10个标签，您应该首先尝试OAA。当N> 1000时，OAA太慢（甚至准确度都很低），如果可以预先选择较少数量的相关标签，则应在大众汽车中尝试ECT（或--log_multi或--csoaa_ldf对于每个例子）。

请参阅http://cilvr.cs.nyu.edu/diglib/lsml/logarithmic.pdf

错误纠正比赛（等）Vowpal Wabbit中的多类分类

1 个答案: