了解countVectorizer ngram返回数据

时间:2017-07-02 23:06:56

标签: python scikit-learn

我是python的新手,我一直在努力理解fit_transform的返回,我的代码是这样的

count_vectorizer = CountVectorizer(ngram_range=(1, 2), min_df=3)
counts = count_vectorizer.fit_transform(learningData) 

我打印了计数,但结果是这样的列表: (4,320)1   (15,396)1   (17,112)1   (19,273)1   (20,273)1 我需要了解(4,320)1代表什么。我在文件中找到了:
X:array,[n_samples,n_features],这是否意味着对于count_vectorizer.get_feature_names()中的第一项,有4个学习数据样本包含它并重复320次? 1代表什么?

对不起,我对这个东西很新。

0 个答案:

没有答案