我在python中使用gensim word2vec库并使用预先训练的GoogleNews-vectors-negative300.bin模型。但是,
我的语料库中有单词,我没有单词向量 得到keyError,我该如何解决这个问题?
border
:GoogleNews-vectors-negative300.bin
model = Word2Vec.load_word2vec_format('GoogleNews-vectors-negative300.bin', binary=True)
print "model loaded..."
请告诉我们如何在预训练的Word2vec模型中添加新单词?
答案 0 :(得分:1)
获取预先训练的矢量 - 例如。 Google News
在gensim中加载模型
继续在gensim中训练模型
这些命令可能派上用场
# Loading pre-trained vectors
model = Word2Vec.load_word2vec_format('/tmp/vectors.bin', binary=True)
# Training the model with list of sentences (with 4 CPU cores)
model.train(sentences, workers=4)