HDP(分层Dirichilet过程)可以检测数据中的主题数量吗?

时间:2016-03-02 04:15:29

标签: machine-learning data-mining gensim topic-modeling unsupervised-learning

我正在使用gensim主题建模软件的HDP(Hierarchical Dirichilet Process)软件包。 Gensim HDP实现期望用户提前提供多个主题(T)。

hdpmodel.HdpModel(self, corpus, id2word,T=150)

文档将T定义为顶级截断级别。

HDP可以自行确定主题数量吗? 是否有可以检测多个主题的HDP实现?任何帮助表示赞赏。

1 个答案:

答案 0 :(得分:0)

您可以尝试使用坚持破坏之前

有些人报告了良好的结果。其他人说它根本不适合他们。

猜猜你必须自己实施,看看它是否有效。