我正在为可能有多个可能的分类器的问题编写机器学习解决方案,具体取决于数据。 所以我收集了几个分类器,在某些情况下,每个分类器的性能都优于其他分类器。 我正在研究元分类策略,我看到有几种算法。任何人都可以指出他们之间的根本区别吗?
答案 0 :(得分:9)
投票算法是一种简单的策略,您可以通过例如参加大多数情况下出现的类来聚合分类器决策的结果。堆叠/分级策略是此概念的概括。而不是简单地说“好吧,我有一个方案v
,我将使用它来选择我的k
分类器中的最佳答案”,你创建了另一个抽象层,在那里你真正学会预测正确的标签获得k
票。
简而言之,基本投票/堆叠/评级方法可概括为:
v
,给出答案a_1,...,a_k
会导致a=v(a_1,...,a_k)
(x_i,y_i)
,您获得(a_i_1,...,a_i_k)
,因此创建训练样本((a_i_1,...,a_i_k),y_i)
并在其上训练元分类器k
分类器训练一个单独的元分类器,以预测其当前点的“分类等级”,并用它来做出决定