使用Gensim分发LDA主题

时间:2017-04-25 17:57:08

标签: gensim lda

我使用python中的gensim package在文档语料库中训练了潜在Dirichlet分配(LDA)模型。

我可以检索以下内容:

  1. 通过一个文档
  2. 分发主题
  3. 主题中词语的分布
  4. 但是,我们如何在整个语料库中获取主题分布(主题概率)?

    例如,如果我们3个主题可以获得整个语料库(不仅仅是一个文档)的分布如下: [主题1:0.5,主题2:0.3,主题3:0.2]

    任何帮助将不胜感激。谢谢。

0 个答案:

没有答案