假设我有两个管道:
pipln1 = Pipeline([("trsfm1",transformer_1),
("trsfm2",transformer_2),
("estmtr1",estimator_1)])
pipln2 = Pipeline([("trsfm1",transformer_1),
("trsfm3",transformer_3),
("estmtr2",estimator_2)])
两个线性管线共享相同的步骤trsfm1
。
是否可以避免两次计算trsfm1
?
答案 0 :(得分:2)
你会喜欢
vect = transformer_1()
#或任何打算做的事!
vX = vect.fit_transform(Xtrain)
或您应用transformer_1
然后是
pipln1 = Pipeline([("trsfm2",transformer_2),
("estmtr1",estimator_1)])
pipln2 = Pipeline([("trsfm3",transformer_3),
("estmtr2",estimator_2)])
,然后在Pipeline
上应用两个vX