sklearn.pipeline是否支持分支?

时间:2018-06-28 15:57:28

标签: python scikit-learn pipeline

假设我有两个管道:

pipln1 = Pipeline([("trsfm1",transformer_1),
                   ("trsfm2",transformer_2),
                   ("estmtr1",estimator_1)])

pipln2 = Pipeline([("trsfm1",transformer_1),
                   ("trsfm3",transformer_3),
                   ("estmtr2",estimator_2)])

两个线性管线共享相同的步骤trsfm1

是否可以避免两次计算trsfm1

1 个答案:

答案 0 :(得分:2)

你会喜欢

vect = transformer_1()#或任何打算做的事!

vX = vect.fit_transform(Xtrain)或您应用transformer_1

的任何适当方式

然后是

pipln1 = Pipeline([("trsfm2",transformer_2),
                   ("estmtr1",estimator_1)])

pipln2 = Pipeline([("trsfm3",transformer_3),
                   ("estmtr2",estimator_2)])

,然后在Pipeline上应用两个vX