标签: lda
我正在进行主题建模的实验。每次我在LDA中运行语料库时,我都会在theta文件中获得P(Z | D)的统一分布(GibbsLDA中的一个输出文件)。
必须设置什么作为超参数来克服这个问题?
我听说alpha可以设置为50 / k,beta可以设置为200 / w,其中k是主题数,w是单词数。有人可以向我解释一下吗?