Sci-kit学习相互依赖的分类器

时间:2018-03-18 20:01:53

标签: python model scikit-learn

我想知道是否有人可以就此主题提供一些一般性指导。

我有一个包含许多类(如400)的多类分类问题,但这些类被分解为不同的列(确切地说是3 3列)。它们也是基于分类的(2取决于1,3取决于2)。我正在尝试找出处理堆叠3个模型的最佳方法,根据从单个文本列(大约30k特征)派生的文档术语矩阵对记录进行分类。

因此,想法是让分类器1对级别1类别进行分类并将相同的DTM馈送到分类器2,但仅具有可用的级别2类别,其是分类器1选择的级别1类别的子集,依此类推。这样,从一个级别到另一个级别就不会有任何不合逻辑的预测。

你知道sci-kit learn是否有一种很好的方法来执行这种相互依赖的建模?如果没有,在熊猫中做到这一点的最佳方法是什么?我想我可以根据先前的预测值过滤1级以上的预测列表,然后取argmax,但不确定这是否会缩放。

0 个答案:

没有答案