什么是获取doc向量值的正确方法?

时间:2019-03-11 13:47:51

标签: python gensim doc2vec

如何获取特定的文档向量值?通过标签,如下所示:

modelValues = model.docvecs['myDocTag']

或者只能通过索引,如下所示:

modelValues = model.docvecs[12]

(在最后一种情况下,我必须知道匹配的tagindex ...)

1 个答案:

答案 0 :(得分:1)

您可以使用任何一种,但应使用与培训期间提供的相同类型的tag键。

因此,如果您在训练期间加标签的文档的字符串标签为'myDocTag',则应使用model.docvecs['myDocTag']

如果您显式提供了普通的int标记,则可以使用model.docvecs[12]。 (但是请注意,在这种情况下,应谨慎分配从0开始的连续整数。)