我花了几周时间尝试学习PyMC,我的主要任务是使用它来构建LDA主题模型。我最初使用PyMC2.3 https://stats.stackexchange.com/questions/104771/latent-dirichlet-allocation-in-pymc尝试了这个例子,但对于一个非常简单的模型,它在一夜之间运行,甚至从未进入采样步骤。因此,我已切换到PyMC3。
是否有任何基本限制,因为随机变量是绝对的?有没有人成功用PyMC3创建LDA模型?我在Unable to create lambda function in hierarchical pymc3 model找到了部分实现,但是如果没有Container,我就无法工作,而且我认为原作者也不能。有谁知道我可以研究的任何资源,以便弄清楚如何构建它?
答案 0 :(得分:0)
TL; DR链接中的实现工作正常,可以在https://github.com/napsternxg/ipython-notebooks/blob/master/PyMC_LDA.ipynb
看到有关就职语音语料库测试的完整代码我使用PyMC2实现了您提到的链接中指定的解决方案,并使其适用于就职演说数据集。我对您提到的链接提供的解决方案的正确性没有信心,但实现工作并给出一些主题分发。然而,解释该实现更适合于更了解LDA的数学定义的人。