在r中使用如下命令可以给出你期望执行的ngram级别:
myDfm <- dfm(txt, ngrams = 2, ignoredFeatures = stopwords("english"))
是否可以给出ngram的范围,如(1,3)?
python中的示例代码:
vectorizer = TfidVectorizer(stop_words=stop_words, use_idf=True, ngram=range(1, 3))
答案 0 :(得分:1)
myDfm <- dfm(txt, ngrams = c(1,3), ignoredFeatures = stopwords("english"))