我使用分布式word2vec算法创建了单词向量。现在我有单词和相应的向量。如何使用这些单词和向量构建gensim word2vec模型?
答案 0 :(得分:3)
我不确定您是否使用gensim
或其他工具创建了word2vec模型,但如果正确理解您的问题,您只想使用gensim加载word2vec模型。这是通过以下方式完成的:
import gensim
w2v_file = codecs.open(WORD2VEC_PATH, encoding='utf-8')
model = gensim.models.KeyedVectors.load_word2vec_format(w2v_file, binary=True) # or binary=False if the model is not compressed
但是,如果您要做的是使用纯gensim
从头开始(即从原始文本)训练word2vec模型,这里是tutorial on how to train word2vec model using gensim。