如何在word2vec中进行每次训练后得到一个向量?

时间:2018-01-15 12:32:11

标签: python-3.x nlp word2vec gensim word-embedding

我想在word2vec中每隔一段时间得到一个单词矢量,例如,我想使用下面的模型。

embedding_model = Word2Vec(test_set, size=300, 
                           window=4, workers=6, 
                           iter=300, sg=1, min_count=10)

在这个模型中,我想获得每50次迭代学习的300维向量,因为我想在html d3中显示连续的学习内容。

我该怎么做?

1 个答案:

答案 0 :(得分:1)

您可以迭代调用train()方法6次,每次使用epochs=50

model = gensim.models.word2vec.Word2Vec(size=300, window=4, workers=6, sg=1, 
                                        min_count=10)
model.build_vocab(sentences)
for i in range(6):
  model.train(sentences, total_examples=model.corpus_count, epochs=50)
  print(model.wv.word_vec('the'))  # get the intermediate vector(s)