我们可以使用经过训练的LDA模型预测新的语料库吗?

时间:2018-03-16 05:05:15

标签: python-3.6 gensim lda topic-modeling

我已经在Python3上的特定主题的2000 URL(包含文章)上训练了LDA模型。我们可以根据训练的模型预测新的语料库吗?

1 个答案:

答案 0 :(得分:0)

假设您的词典命名为 dic_1 new_corpus 是文档集合。

我们首先通过以下方式创建一个gensim语料库:

对于new_corpus中的doc,

corpus_1 = [dic_1.doc2bow(tokenize(doc))

现在我们可以通过以下方式使用训练模型进行预测:

new_predictions = LDA [corpus_1]