分析自定义sklearn管道

时间:2020-04-21 21:11:46

标签: python scikit-learn profiling pipeline

我为我的项目创建了一个sklearn管道,其中包括两个组件,sys.stderrdata_transform,如下所示。

model

我将fit方法称为model = Pipeline([ ('data_transform', XYZ(p1=arg1, p2=arg2)), ('model', LogisticRegressionCV(solver='sag', multi_class='multinomial', class_weight='balanced', max_iter=5000))]) 。由于我的代码花费了大量时间,因此我想检查每个组件(即model.fit(X_train, y_train)data_transform)所花费的时间。有什么方法可以找到我需要的时间?

1 个答案:

答案 0 :(得分:0)

@tailwind utilities设置verbose=True,当应用fit方法时,您将看到管道的每个步骤所花费的时间。

方法如下:

Pipeline

以及执行操作时

model = Pipeline(steps=[
    ('data_transform', XYZ(p1=arg1, p2=arg2)),
    ('model', LogisticRegressionCV(solver='sag', multi_class='multinomial', class_weight='balanced', max_iter=5000))],
                 verbose=True)

您将看到类似的输出(我在此处粘贴管道的输出) enter image description here