Question

我正在使用gensim的Doc2vec来学习新闻文章的功能。我可以成功地训练我的文件。但是，我很难从模型中检索文档向量以进行进一步处理。

from gensim.models.doc2vec import Doc2Vec, TaggedDocument
from gensim.test.utils import common_texts

documents = [TaggedDocument((doc), [i]) for i, doc in enumerate(common_texts)]
model = Doc2Vec(documents, vector_size=5, window=2, min_count=1, workers=4)

这可以正确训练，没有错误。

如果我尝试直接使用model.docvecs或像这样遍历它：

for vector in model.docvecs:
    print(vector)

我收到此错误：

KeyError: "tag '9' not seen in training corpus/invalid"

这是什么原因，我该如何解决？

谢谢！

Answer 1

解决了...

我需要使用

model.docvecs.doctag_syn0 （即将不推荐使用）

或

model.docvecs.vectors_docs

Gensim Doc2vec – KeyError：“在训练语料库中未看到标签/无效”

1 个答案: