我正在使用gensim的Doc2vec来学习新闻文章的功能。我可以成功地训练我的文件。但是,我很难从模型中检索文档向量以进行进一步处理。
示例代码(直接取from gensim's documentation):
from gensim.models.doc2vec import Doc2Vec, TaggedDocument
from gensim.test.utils import common_texts
documents = [TaggedDocument((doc), [i]) for i, doc in enumerate(common_texts)]
model = Doc2Vec(documents, vector_size=5, window=2, min_count=1, workers=4)
这可以正确训练,没有错误。
如果我尝试直接使用model.docvecs
或像这样遍历它:
for vector in model.docvecs:
print(vector)
我收到此错误:
KeyError: "tag '9' not seen in training corpus/invalid"
这是什么原因,我该如何解决?
谢谢!
答案 0 :(得分:0)
解决了...
我需要使用
model.docvecs.doctag_syn0
(即将不推荐使用)
或
model.docvecs.vectors_docs