在管道中使用不同的矢量化器

时间:2019-04-09 11:53:18

标签: python-3.x scikit-learn

我正在尝试与pipeline一起运行gridsearchCV,我想运行两次管道和gridsearch,一次是使用CountVectorizer向量化的数据集,其次是使用{{ 1}}以及用于Logistic回归的所有不同参数。

现在我有两个不同的程序,一个程序仅实现计数矢量化程序,第二个程序仅实现tfidf:

TfidfVectorizer

第二:

lr_tfidf = Pipeline([
                     ('tfidf', tfidf)
                     ('clf',
                      LogisticRegression(random_state=0, 
                                         multi_class="multinomial",
                                         solver="newton-cg",
                                         verbose=0))])

gs_lr_tfidf = GridSearchCV(lr_tfidf,
                           param_grid,
                           scoring='accuracy',
                           cv=2,
                           verbose=5,
                           n_jobs=-1)

我如何将这两个程序“融合”在一起,以便使用矢量化器的两种组合执行多个管道/网格搜索?

0 个答案:

没有答案