主题建模中的困惑

时间:2016-04-19 04:33:48

标签: text-mining cross-validation training-data topic-modeling

我在训练数据上使用主题模型包运行LDA。如何确定拟合模型的困惑?我阅读了说明书,但我不确定应该使用哪种代码。

这是我到目前为止所拥有的:

burnin <- 500
iter <- 1000
#keep <- 30
k <- 4

results_training <- LDA(dtm_training, k,
                method = "Gibbs",
                control = list(burnin = burnin,
                               iter = iter))

Terms <- terms(results_training, 10)

Topic <- topics(results_training, 4)

# Get the posterior probability for each document over each topic
posterior <- posterior(results_training)[[2]]

它完美无缺,但现在我的问题是如何在测试数据(results_testing)上使用困惑?我怎样才能解释困惑的结果?

由于

0 个答案:

没有答案