现在我想构建元分类器,它将概率作为输入并学习这两个分类器的权重。 因此,它会自动决定我应该信任多少"我的每个分类器。
这个模型在这里描述:
http://rasbt.github.io/mlxtend/user_guide/classifier/StackingClassifier/#stackingclassifier
我计划使用mlxtend库,但似乎StackingClassifier改进了模型。
我不想改装,因为它需要非常大的时间。
另一方面,我知道重新安装是必要的,以协调"每个分类器的工作和"调整"整个系统。
在这种情况下我该怎么做?
答案 0 :(得分:1)
我不会谈论mlxtend
,因为我没有使用它,但我会告诉你一般的想法。
您不必将这些模型重新设置为训练集,但您必须将它们重新设置为部分模型,以便您可以创建折叠预测。
具体而言,将训练数据分成几部分(通常为3到10)。保持一件(即折叠)作为验证数据并在另一个折叠上训练两个模型。然后,使用两种模型预测验证数据的概率。重复处理每个折叠的程序作为验证集。最后,您应该具有训练集中所有数据点的概率。
然后,您可以使用这些概率和地面真实标签来训练元分类器。您可以在新数据上使用经过培训的元分类器。