如果我有两个非常不同的数据集和两种截然不同的分类技术,有没有一种很好的方法来组合两个输出?我理解平均值可能有效,但有更相关的方法吗?我听说过有关增强和集成学习等几个概念,这些概念是否适用?
答案 0 :(得分:3)
有两种方法可以解决这个问题。第一个称为提升,使用加权投票来决定预测。主要思想是结合两种分类器的优点。
第二种方法,称为堆叠,使用两个分类器的输出作为另一个分类器的特征(可能具有其他特征,例如原始分类器),并使用最终分类器的输出预测。
如果没有进一步的细节,这是我能给出的最佳答案。
有关详情,请参阅Stats.SE上的Bagging, boosting and stacking in machine learning。