如何为sklearn

时间:2015-11-20 04:52:25

标签: python machine-learning scikit-learn

我想为一组有限的词汇进行特征哈希。 例如:一组文件中的前1000个单词

我知道CountVectorizer有一个名为词汇表的输入参数,它只计算那些少量的词汇。 Feature Vectorizer中是否有类似的功能。如果不是我怎么能这样做?

非常感谢任何帮助

谢谢

0 个答案:

没有答案