标签: nlp gensim lda topic-modeling doc2vec
我使用Doc2Vec在我的语料库中记录了相似性,并且输出的相似性并不高。我想知道我是否可以根据Doc2Vec给我的主题模型来提高模型的准确性以获得更好的相似性?
答案 0 :(得分:1)
您应该从原始语料库中训练一个新模型(如LDA)。
如果Doc2Vec流程给出的原生相似性不是很好,也许您可以通过调整流程来改进它们。
但是,如果这不起作用,那么Doc2Vec也没有从您的数据中提取有用信息 - 并且基于那些(坏)原始数字的下游计算不可能神奇地变得更好。