我在python中使用Gensim Library来使用和训练word2vector模型。最近,我正在考虑用一些预先训练过的word2vec模型初始化我的模型权重,例如(GoogleNewDataset预训练模型)。几周以来我一直在努力。现在,我刚刚搜索出来,在gesim中有一个函数可以帮助我用预先训练的模型权重初始化我的模型的权重。这将在下面提到:
reset_from(other_model)
Borrow shareable pre-built structures (like vocab) from the other_model. Useful if testing multiple models in parallel on the same corpus.
我不知道这个功能可以做同样的事情。请帮忙!!!
答案 0 :(得分:1)
您现在可以使用gensim进行增量培训。我建议加载预训练模型,然后进行更新。
from gensim.models import Word2Vec
model = Word2Vec.load('pretrained_model.emb')
model.build_vocab(new_sentences, update=True)
model.train(new_sentences)