应用错误收集

我可以从doc2vec模型的输出创建主题模型（例如LDA）吗？

时间：2017-07-21 17:19:59

标签： nlp gensim lda topic-modeling doc2vec

我使用Doc2Vec在我的语料库中记录了相似性，并且输出的相似性并不高。我想知道我是否可以根据Doc2Vec给我的主题模型来提高模型的准确性以获得更好的相似性？

1 个答案:

答案 0 :(得分：1)

您应该从原始语料库中训练一个新模型（如LDA）。

如果Doc2Vec流程给出的原生相似性不是很好，也许您可以通过调整流程来改进它们。

但是，如果这不起作用，那么Doc2Vec也没有从您的数据中提取有用信息 - 并且基于那些（坏）原始数字的下游计算不可能神奇地变得更好。