如何使用预先训练过的单词向量创建gensim word2vec模型?

时间:2017-10-12 03:59:07

标签: nlp gensim word2vec text-analysis word-embedding

我使用分布式word2vec算法创建了单词向量。现在我有单词和相应的向量。如何使用这些单词和向量构建gen​​sim word2vec模型?

1 个答案:

答案 0 :(得分:3)

我不确定您是否使用gensim或其他工具创建了word2vec模型,但如果正确理解您的问题,您只想使用gensim加载word2vec模型。这是通过以下方式完成的:

import gensim
w2v_file = codecs.open(WORD2VEC_PATH, encoding='utf-8')
model = gensim.models.KeyedVectors.load_word2vec_format(w2v_file, binary=True)  # or binary=False if the model is not compressed

但是,如果您要做的是使用纯gensim从头开始(即从原始文本)训练word2vec模型,这里是tutorial on how to train word2vec model using gensim

相关问题