标签: gensim lda
我使用python中的gensim package在文档语料库中训练了潜在Dirichlet分配(LDA)模型。
我可以检索以下内容:
但是,我们如何在整个语料库中获取主题分布(主题概率)?
例如,如果我们3个主题可以获得整个语料库(不仅仅是一个文档)的分布如下: [主题1:0.5,主题2:0.3,主题3:0.2]
任何帮助将不胜感激。谢谢。