有没有一种方法可以在doc2vec中获得每个段落的等效向量列表?

时间:2020-05-02 20:00:32

标签: python doc2vec

是否可以使用doc2vec查看我按段落而不是按单词中的每个单词获得的向量。通过使用model.wv.vectors,我可以获得每个单词的所有向量。现在,我需要这样做,以便在希望获得的嵌入段落上应用聚类算法。我不确定这种方法是否有效。这是段落的外观:

[TaggedDocument(words=['this', 'is', 'the', 'effect', 'of', 'those', 'states', 'that', 'went', 'into', 'lockdown', 'much', 'later', 'they', 'are', 'just', 'starting', 'to', 'see', 'the', 'large', 'increase', 'now', 'they', 'have', 'to', 'ride', 'it', 'out', 'and', 'hope', 'for', 'the', 'best'], tags=[0])

TaggedDocument(words=['so', 'see', 'the', 'headline', 'is', 'died', 'not', 'revised', 'predictions', 'show', 'more', 'hopeful', 'situation', 'or', 'new', 'york', 'reaching', 'apex', 'long', 'before', 'experts', 'predicted', 'or', 'any', 'such', 'thing', 'got', 'to', 'keep', 'the', 'panic', 'train', 'rolling', 'see'], tags=[1])]

1 个答案:

答案 0 :(得分:0)

model.docvecs.vectors将包含所有经过训练的文档向量。