不知道在标题中说得最好。
这就是我要做的事情:我正在使用GridSearch
和pipeline
来训练分类器。我希望看到最佳估算工具使用的vocabulary_.items()
CountVectorizer
。
现在,我在运行GridSearch
:
classifier = gs_clf.best_estimator_
vect = classifier.named_steps["vec"]
data = vect.fit_transform(x_train)
vocab = = vect.vocabulary_.items()
有没有办法直接获取词汇项,而不再在fit_transform
上使用CountVectorizer
?