使用自定义ngram列表创建稀疏矩阵?

时间:2018-06-04 18:10:15

标签: python sparse-matrix text-classification n-gram

我正在尝试使用一堆单词创建一个用于文本分类的稀疏矩阵,但问题是我的代码根据文本本身创建了ngram。我有一个自定义ngram列表,我想为其创建稀疏矩阵。我如何在Python中执行此操作? 下面是我编写的代码,它自己使用ngram创建稀疏矩阵:

vectorizer = CountVectorizer(
analyzer = 'word',
lowercase = True,
stop_words = 'english',
max_features = 85
)
corpus_data_features = vectorizer.fit_transform(train_data.Query.tolist())

0 个答案:

没有答案