我想将过采样程序(例如SMOTE oversampling)添加到scikit的Pipeline中。但transformers仅支持fit
和transform
方法,并且没有提供增加样本和目标数量的方法。
执行此操作的一种可能方法是将管道分解为通过SMOTE采样连接的两个单独的管道。
有没有更好的解决方案?
答案 0 :(得分:3)
我们当前的Pipeline
不支持更改步骤之间的样本数,因为Transformer.transform
方法不返回需要重新采样的y
参数。这是当前设计的已知限制。它可能会在未来版本中修复,但我们还没有开始研究它。