LDA是否提供新数据的预测?

时间:2019-03-20 14:58:17

标签: python lda

我正在使用gensim训练我的ldamodel,并使用像这样的ldamodel [doc_term_matrix_test]这样的测试语料进行预测,效果很好,但我不明白如何使用训练后的模型实际进行预测(ldamodel [doc_term_matrix_test]在做什么)。 这是代码:

dictionary2 = corpora.Dictionary(test)
dictionary = corpora.Dictionary(train)
dictionary.merge_with(dictionary2)
doc_term_matrix2 = [dictionary.doc2bow(doc) for doc in test]
doc_term_matrix = [dictionary.doc2bow(doc) for doc in train]
Lda = gensim.models.ldamodel.LdaModel
ldamodel = Lda(doc_term_matrix, num_topics=2, id2word = 
dictionary,random_state=100, iterations=50, passes=1)
topics = sorted(ldamodel[doc_term_matrix2],key=lambda 
 x:x[1],reverse=True)

1 个答案:

答案 0 :(得分:1)

引用gensim docs about ldamodel

  

该模块既允许从训练语料库估计LDA模型,又可以推断未见过的新文档的主题分布。

因此,显然,您的代码所做的不是完全“预测”而是推理。也就是说,您训练有素的LDA模型会为每个测试文档T产生T主题分布的估计值。