仅从Tfidf Vectorizer中选择前n个功能

时间:2018-06-13 07:30:03

标签: python nltk tfidfvectorizer

var_vector = TfidfVectorizer()
train_var = var_vector.fit_transform(t_df['var'])

top_100 = np.array(var_vector.get_feature_names())
tfidf_100 = np.argsort(var_vector.idf_)[::-1]

n = 100
top_n = top_100[tfidf_100][:n]

从tfidf Vectorizer中选择前100个单词后,如何将维度更新为100?

1 个答案:

答案 0 :(得分:0)

max_features参数设置为100。 请参阅文档here