如何正确组合我的分类器?

时间:2017-08-02 08:57:17

标签: machine-learning ensemble-learning mlxtend

  • 我必须解决 2类分类问题
  • 我有输出概率的 2分类器。它们都是不同架构的神经网络。 这两个分类器经过培训并保存为2个文件。

现在我想构建元分类器,它将概率作为输入并学习这两个分类器的权重。 因此,它会自动决定我应该信任多少"我的每个分类器。

这个模型在这里描述:
http://rasbt.github.io/mlxtend/user_guide/classifier/StackingClassifier/#stackingclassifier
我计划使用mlxtend库,但似乎StackingClassifier改进了模型。
我不想改装,因为它需要非常大的时间。
另一方面,我知道重新安装是必要的,以协调"每个分类器的工作和"调整"整个系统。

在这种情况下我该怎么做?

1 个答案:

答案 0 :(得分:1)

我不会谈论mlxtend,因为我没有使用它,但我会告诉你一般的想法。

您不必将这些模型重新设置为训练集,但您必须将它们重新设置为部分模型,以便您可以创建折叠预测。

具体而言,将训练数据分成几部分(通常为3到10)。保持一件(即折叠)作为验证数据并在另一个折叠上训练两个模型。然后,使用两种模型预测验证数据的概率。重复处理每个折叠的程序作为验证集。最后,您应该具有训练集中所有数据点的概率。

然后,您可以使用这些概率和地面真实标签来训练元分类器。您可以在新数据上使用经过培训的元分类器。