Gensim Doc2vec – KeyError:“在训练语料库中未看到标签/无效”

时间:2018-12-15 20:04:59

标签: python gensim doc2vec

我正在使用gensim的Doc2vec来学习新闻文章的功能。我可以成功地训练我的文件。但是,我很难从模型中检索文档向量以进行进一步处理。

示例代码(直接取from gensim's documentation):

from gensim.models.doc2vec import Doc2Vec, TaggedDocument
from gensim.test.utils import common_texts

documents = [TaggedDocument((doc), [i]) for i, doc in enumerate(common_texts)]
model = Doc2Vec(documents, vector_size=5, window=2, min_count=1, workers=4)

这可以正确训练,没有错误。

如果我尝试直接使用model.docvecs或像这样遍历它:

for vector in model.docvecs:
    print(vector)

我收到此错误:

KeyError: "tag '9' not seen in training corpus/invalid"

这是什么原因,我该如何解决?

谢谢!

1 个答案:

答案 0 :(得分:0)

解决了...

我需要使用

model.docvecs.doctag_syn0 (即将不推荐使用)

model.docvecs.vectors_docs