我已经在Python3上的特定主题的2000 URL(包含文章)上训练了LDA模型。我们可以根据训练的模型预测新的语料库吗?
答案 0 :(得分:0)
假设您的词典命名为 dic_1 , new_corpus 是文档集合。
我们首先通过以下方式创建一个gensim语料库:
对于new_corpus中的doc,corpus_1 = [dic_1.doc2bow(tokenize(doc))
现在我们可以通过以下方式使用训练模型进行预测:
new_predictions = LDA [corpus_1]