Scikit在向量化器中学习ngram_range的目的

时间:2013-11-30 12:52:55

标签: scikit-learn

ngram_range在vectorvectorizer和TFidf vectorizer等矢量化器中有什么用?我的意思是ngram_range(1,1)用于unigram。这对于ngram_range(1,2)和(2,2)

意味着什么

1 个答案:

答案 0 :(得分:9)

ngram_range(1,2)表示unigrams和bigrams,(2,2)表示只有bigrams .. 你不认为docstring足够精确:

要提取的不同n-gram的n值范围的下边界和上边界。将使用n的所有值,使得min_n< = n< = max_n。

您如何更改文档字符串以获得更多帮助?