应用错误收集

时间：2013-09-14 14:59:11

标签： machine-learning classification supervised-learning

我正在为可能有多个可能的分类器的问题编写机器学习解决方案，具体取决于数据。所以我收集了几个分类器，在某些情况下，每个分类器的性能都优于其他分类器。我正在研究元分类策略，我看到有几种算法。任何人都可以指出他们之间的根本区别吗？

答案 0 :(得分：9)

投票算法是一种简单的策略，您可以通过例如参加大多数情况下出现的类来聚合分类器决策的结果。堆叠/分级策略是此概念的概括。而不是简单地说“好吧，我有一个方案v，我将使用它来选择我的k分类器中的最佳答案”，你创建了另一个抽象层，在那里你真正学会预测正确的标签获得k票。

简而言之，基本投票/堆叠/评级方法可概括为：

投票 - 你有一些常量方法v，给出答案a_1,...,a_k会导致a=v(a_1,...,a_k)
堆叠 - 您使用答案作为问题的新表示，因此对于每个(x_i,y_i)，您获得(a_i_1,...,a_i_k)，因此创建训练样本((a_i_1,...,a_i_k),y_i)并在其上训练元分类器
评分 - 为每个k分类器训练一个单独的元分类器，以预测其当前点的“分类等级”，并用它来做出决定