标签: text-mining hidden-markov-models mallet lda topic-modeling
我正在使用 Mallet 库来处理Java项目。
我有15,000个文档,每个文档有400个令牌。我尝试使用ParallelTopicModel。但我希望有一组包含单个令牌和令牌序列的主题(例如“Java”以及“Java Developer”)。
ParallelTopicModel
我正在考虑使用LDA-HMM。我可以使用哪种Mallet?
然后我将每个主题转换为贝叶斯网络的节点,以接收令牌或令牌序列作为证据,并做出推论。我可以使用哪个Java库?
提前致谢。 弗朗西斯