应用错误收集

使用Latent dirichlet分配-GibbsLDA工具

时间：2016-02-18 08:17:15

标签： lda

我正在进行主题建模的实验。每次我在LDA中运行语料库时，我都会在theta文件中获得P（Z | D）的统一分布（GibbsLDA中的一个输出文件）。

必须设置什么作为超参数来克服这个问题？

我听说alpha可以设置为50 / k，beta可以设置为200 / w，其中k是主题数，w是单词数。有人可以向我解释一下吗？

0 个答案:

没有答案