如何在scikit的管道中添加过采样/欠采样程序?

时间:2015-03-29 14:07:19

标签: python scikit-learn

我想将过采样程序(例如SMOTE oversampling)添加到scikit的Pipeline中。但transformers仅支持fittransform方法,并且没有提供增加样本和目标数量的方法。

执行此操作的一种可能方法是将管道分解为通过SMOTE采样连接的两个单独的管道。

有没有更好的解决方案?

1 个答案:

答案 0 :(得分:3)

我们当前的Pipeline不支持更改步骤之间的样本数,因为Transformer.transform方法不返回需要重新采样的y参数。这是当前设计的已知限制。它可能会在未来版本中修复,但我们还没有开始研究它。