我使用scikit-learn LDA
生成LDA模型,之后我可以获得主题术语。我想知道如何获得每个文档的每个主题的概率?
答案 0 :(得分:1)
在拟合模型后使用transform
类的LatentDirichletAllocation
方法。它将返回文档主题分发。
如果您使用example given in the documentation进行scikit-learn的Latent Dirichlet分配,可以通过在代码中附加以下行来访问文档主题分发:
doc_topic_dist = lda.transform(tf)
此处,lda
是经过培训的LDA模型,tf
是文档字矩阵。