ngram_range在vectorvectorizer和TFidf vectorizer等矢量化器中有什么用?我的意思是ngram_range(1,1)用于unigram。这对于ngram_range(1,2)和(2,2)
意味着什么答案 0 :(得分:9)
ngram_range(1,2)表示unigrams和bigrams,(2,2)表示只有bigrams .. 你不认为docstring足够精确:
要提取的不同n-gram的n值范围的下边界和上边界。将使用n的所有值,使得min_n< = n< = max_n。
您如何更改文档字符串以获得更多帮助?