如何获取pyLDAvis中每个主题的单词列表

时间:2018-11-08 23:10:07

标签: nlp lda

我不熟悉pyLDAvis。我一直在浏览文档,但似乎无法找到一种方法来获取模型中每个主题的词汇。我有20个主题,并且每个主题我都希望获得前20个左右的词。有人可以获取这些数据吗?

1 个答案:

答案 0 :(得分:2)

pyldavis.prepare()方法产生一个PreparedData对象,该对象具有.topic_info之类的属性,该对象返回带有单词logprob等的DataFrame(请参见docs

from pyLDAvis.gensim import prepare
vis = prepare(lda_model, corpus, dictionary, mds='tsne')
vis.topic_info

     Category         Freq       Term        Total  loglift  logprob
term                                                                
2299  Default 2,068,609.00      order 2,068,609.00    30.00    30.00
1037  Default   816,951.00      drink   816,951.00    29.00    29.00
2778  Default   565,075.00     review   565,075.00    28.00    28.00