LDA与R的topicmodels包,如何获得每个术语的主题概率?

时间:2016-01-25 22:16:28

标签: r lda topicmodels

我正在使用LDA的topicmodels包。我想创建一个可视化,显示每个主题的相关或不相关。我设想了一组主题1独有的单词,但是有一些共享的关键字连接到另一个主题。这里的任何建议都会很棒。继续:

为此,我需要知道每个主题的每个术语概率。如何使用topicmodels包获得此功能?我可以通过以下方式查看条款:

terms(LDAmodel, 15)

但我不知道如何获得价值。想法?

1 个答案:

答案 0 :(得分:1)

您可以使用posterior()$terms来获取每个字词的后验概率。 posterior()$topics给出了文档的概率。

改编自help(LDA)的示例:

data("AssociatedPress", package = "topicmodels")
lda <- LDA(AssociatedPress[1:20,], k = 2)
terms <- posterior(lda)$terms

## posterior probability for the first 5 terms (alphabetically)
terms[,1:5]
         aaron      abandon    abandoned   abandoning       abbott
1 3.720076e-44 3.720076e-44 3.720076e-44 3.720076e-44 3.720076e-44
2 3.720076e-44 3.720076e-44 3.720076e-44 3.720076e-44 3.720076e-44