应用错误收集

带有包装器方法的集合分类器

时间：2012-11-17 08:36:57

标签： matlab machine-learning data-mining weka classification

我正在尝试使用集成学习（viting，stacking等等）组合多个分类器（ANN，SVM，kNN等）。

为了制作分类器，我使用了20多种解释变量。但是，每个分类器都有最好的解释变量子集。因此，在包装器方法中寻找每个分类器的解释变量的最佳组合，我想结合多个分类器（ANN，SVM，kNN，...等）使用集合学习（viting，stacking ...等）。

通过使用weka的元学习，我应该能够使用整体本身。但是我无法获得解释变量的最佳组合，因为包装器方法总结了每个分类器的预测。

如果可以在matlab或R中轻松解决，我不会坚持使用weka。

1 个答案:

答案 0 :(得分：1)

使用集合方法，使用简单分类器可以获得最佳结果。另一方面，这可以很快，以弥补整体成本。

这可能看起来有点违反直觉：人们会使用更好的输入分类器来产生更好的输出。但是，有两个原因导致这种情况无效。

首先，使用简单的分类器，您通常可以对它们进行更多调整以获得各种输入分类器。全维方法+功能包装为您提供了多种分类器。内部进行特征选择或缩减的分类器使得功能包装在很大程度上不受影响。其次，诸如SVM之类的复杂方法更可能针对完全相同的结果进行优化/收敛。毕竟，复杂的方法应该通过一个更大的搜索空间，并在这个搜索空间中找到最好的结果。但这也意味着，你更有可能再次获得相同的结果。最后但并非最不重要的是，当使用非常原始的分类器时，错误表现更好，更有可能在整体组合上均匀。