如何为包含双字母组的列表生成TFIDF向量或术语文档矩阵

时间:2019-07-18 07:16:23

标签: python-3.x n-gram tfidfvectorizer term-document-matrix

我想为包含已经词量很大的单词的列表生成TFIDF向量或术语文档矩阵。

bigram_list = ['i need', 'answers please', 'thanks alot']

常规的TFIDFVectorizer有一个我不想使用的ngram_range参数,因为我已经生成了与传统bigram不同的bigram,因为它们没有重叠。

0 个答案:

没有答案