适用于主题模型的正确的Mallet类

时间:2012-04-24 09:47:26

标签: text-mining hidden-markov-models mallet lda topic-modeling

我正在使用 Mallet 库来处理Java项目。

我有15,000个文档,每个文档有400个令牌。我尝试使用ParallelTopicModel。但我希望有一组包含单个令牌和令牌序列的主题(例如“Java”以及“Java Developer”)。

我正在考虑使用LDA-HMM。我可以使用哪种Mallet?

然后我将每个主题转换为贝叶斯网络的节点,以接收令牌或令牌序列作为证据,并做出推论。我可以使用哪个Java库?

提前致谢。 弗朗西斯

0 个答案:

没有答案