我可以从doc2vec模型的输出创建主题模型(例如LDA)吗?

时间:2017-07-21 17:19:59

标签: nlp gensim lda topic-modeling doc2vec

我使用Doc2Vec在我的语料库中记录了相似性,并且输出的相似性并不高。我想知道我是否可以根据Doc2Vec给我的主题模型来提高模型的准确性以获得更好的相似性?

1 个答案:

答案 0 :(得分:1)

您应该从原始语料库中训练一个新模型(如LDA)。

如果Doc2Vec流程给出的原生相似性不是很好,也许您可​​以通过调整流程来改进它们。

但是,如果这不起作用,那么Doc​​2Vec也没有从您的数据中提取有用信息 - 并且基于那些(坏)原始数字的下游计算不可能神奇地变得更好。