我不熟悉pyLDAvis。我一直在浏览文档,但似乎无法找到一种方法来获取模型中每个主题的词汇。我有20个主题,并且每个主题我都希望获得前20个左右的词。有人可以获取这些数据吗?
答案 0 :(得分:2)
pyldavis.prepare()
方法产生一个PreparedData
对象,该对象具有.topic_info
之类的属性,该对象返回带有单词logprob
等的DataFrame(请参见docs)>
from pyLDAvis.gensim import prepare
vis = prepare(lda_model, corpus, dictionary, mds='tsne')
vis.topic_info
Category Freq Term Total loglift logprob
term
2299 Default 2,068,609.00 order 2,068,609.00 30.00 30.00
1037 Default 816,951.00 drink 816,951.00 29.00 29.00
2778 Default 565,075.00 review 565,075.00 28.00 28.00