我使用默认的word2vec训练(dm = 1)训练了gensim的Doc2Vec模型。我可以从model.wv.vectors中的全局模型中获取单词vector。 但是documentation说,根据出现的文档上下文,相同的单词(在示例中为“ leaves”)不会具有相同的向量。
所以我有点困惑:在model.wv.vectors中,示例中的“ leaves”一词对于用于训练模型的所有文档都具有相同的向量(这可能与我的理解相矛盾。从文档)?如果没有,如何从特定文档中获取单词向量?
答案 0 :(得分:0)
该文档具有误导性。单词标记'leaves'
在该模型中将只有一个单词向量。
我猜测该评论的作者可能意味着在PV-DM模式(dm=1
)中进行模型训练期间,训练预测将受到组合的影响该文本的单词向量和“浮动”文档向量(以及上下文窗口中其他相邻的单词向量)的大小。但是,一个单词只有一个向量,那里的描述很混乱。