标签: machine-learning tf-idf
我正在使用600个句子,它们属于三个类别:中性,肯定和否定。
我使用CountVectorizer对它们进行矢量化处理,现在我想使用tfidftransformer对它们进行加权。
CountVectorizer
tfidftransformer
可以将use_idf的{{1}}的{{1}}参数与scikit-learn一起使用吗?背后的理论是什么?
use_idf
scikit-learn
我对tfidftransformer表示怀疑,因为它代表相反的文档频率,在这里我仅使用句子而不是文档。
True