有没有办法根据scikit中的Tfidfvectorizer输出选择前100或1000个单词

时间:2013-10-26 07:40:18

标签: python scikit-learn scikits

我正在尝试根据Python的scikit-learn库的tfidfVectorizer输出找到前100/1000个单词。有没有办法使用scikit库中的函数来完成它?

感谢您的帮助

1 个答案:

答案 0 :(得分:0)

前100/1000字是什么意思?数据集中最常用的单词?您可以使用Python标准库的Counter类来执行此操作。不需要scikit-learn。