CountVectorizer是否应该同时安装在训练集和测试集上?

时间:2019-08-01 10:01:20

标签: python python-3.x scikit-learn countvectorizer

我在线上浏览了许多文章,其中一些建议CountVectorizer应该同时适用于火车和测试仪,而另一些建议仅将其适用于列车。 通常哪种方法更适合文本分类?

1 个答案:

答案 0 :(得分:2)

通常test_set应当保持不被观察,因此CountVectorizer应该仅安装在train_set