您为Python推荐的pLSA(概率潜在语义分析)和LDA(潜在Dirichlet分配)包是什么? Java和C ++也可以,但Python更受欢迎。 非常感谢您的体验。
有很多库,所以我不知道选择哪个。
答案 0 :(得分:13)
Gensim似乎是最受欢迎的一个。 It's on PyPI所以,你可以使用
安装它sudo easy_install gensim
答案 1 :(得分:1)
在python中有一个很好的LDA示例实现,可以在这里找到:http://www.cs.princeton.edu/~blei/topicmodeling.html,tarball链接在这里:http://www.cs.princeton.edu/~blei/downloads/onlineldavb.tar
它不是一个库,而是一个自动下载维基百科文章并运行LDA的示例实现。但我发现它作为实现我自己的LDA代码的参考非常有用。