在主题建模中将Word2vec输出用作LDA的输入

时间:2019-11-25 15:29:50

标签: machine-learning deep-learning topic-modeling

我已经读到,用于主题建模(从文本中提取可能的主题)的最常用技术是潜在Dirichlet分配(LDA)。但是最近我了解了另一种型号lda2vec。但是,我对尝试将Word2Vec输出作为LDA的输入是否一个好主意感兴趣。

您认为为了某些研究而采用这种方法是否有意义?在我进行主题建模时,需要一些新颖的方法。

1 个答案:

答案 0 :(得分:0)

那是一个好主意,并且已经有一些论文。我建议您搜索“单词嵌入+ LDA”而不是word2vec。有趣的是,甚至David Blei本人(LDA的发明者)也说他正在考虑在recent interview中做类似的事情。