我正在尝试与pipeline
一起运行gridsearchCV
,我想运行两次管道和gridsearch,一次是使用CountVectorizer
向量化的数据集,其次是使用{{ 1}}以及用于Logistic回归的所有不同参数。
现在我有两个不同的程序,一个程序仅实现计数矢量化程序,第二个程序仅实现tfidf:
TfidfVectorizer
第二:
lr_tfidf = Pipeline([
('tfidf', tfidf)
('clf',
LogisticRegression(random_state=0,
multi_class="multinomial",
solver="newton-cg",
verbose=0))])
gs_lr_tfidf = GridSearchCV(lr_tfidf,
param_grid,
scoring='accuracy',
cv=2,
verbose=5,
n_jobs=-1)
我如何将这两个程序“融合”在一起,以便使用矢量化器的两种组合执行多个管道/网格搜索?