错误纠正比赛(等)Vowpal Wabbit中的多类分类

时间:2014-07-07 09:41:27

标签: classification vowpalwabbit

我试图通过this paper来描述ECT算法,但无法从中获得很多。

我知道它与one-against-al(oaa)不同,甚至比oaa表现更好。我想要一个关于ect如何工作的简单解释。

1 个答案:

答案 0 :(得分:3)

如果您有非常多的输出标签(类),ECT和Filter树是有用的(仅限),假设N = 1000。使用OAA(一对一),它意味着为每个示例(在训练和测试期间)执行N个二进制分类任务。使用ECT,您可以更快地进行预测:log(N)。您可以将过滤树(它是ECT的基础)想象为决策树,在每个节点中,您询问该示例是属于一组标签还是另一组标签(使用所有要素,与原始决策树不同)。 / p>

一般而言,ECT比OAA更差(在损失或准确性方面)(但在某些情况下,它可能几乎与OAA一样好)。如果N = 10个标签,您应该首先尝试OAA。当N> 1000时,OAA太慢(甚至准确度都很低),如果可以预先选择较少数量的相关标签,则应在大众汽车中尝试ECT(或--log_multi--csoaa_ldf对于每个例子)。

请参阅http://cilvr.cs.nyu.edu/diglib/lsml/logarithmic.pdf