使用Latent dirichlet分配-GibbsLDA工具

时间:2016-02-18 08:17:15

标签: lda

我正在进行主题建模的实验。每次我在LDA中运行语料库时,我都会在theta文件中获得P(Z | D)的统一分布(GibbsLDA中的一个输出文件)。

必须设置什么作为超参数来克服这个问题?

我听说alpha可以设置为50 / k,beta可以设置为200 / w,其中k是主题数,w是单词数。有人可以向我解释一下吗?

0 个答案:

没有答案