标签: python machine-learning scikit-learn
我想为一组有限的词汇进行特征哈希。 例如:一组文件中的前1000个单词
我知道CountVectorizer有一个名为词汇表的输入参数,它只计算那些少量的词汇。 Feature Vectorizer中是否有类似的功能。如果不是我怎么能这样做?
非常感谢任何帮助
谢谢