如何在numpy.ndarray中获取键值对? (Gensim Word2vec)

时间:2016-10-21 16:59:08

标签: python performance gensim word2vec

我试图获取向量model.syn0中的向量以及向量model.syn0["word"]的向量,它给出了n-dim向量。是否有更好的方法来创建模型中所有单词的列表,其顺序与syn0的向量相同?我有350000个单词,这需要太长时间。

from gensim.models import word2vec as wv
model = wv.Word2Vec.load('model')
lab=[]
for i in model.syn0:
    lab.append(model.similar_by_vector(i)[0])

print(type(model.syn0))
    <type 'numpy.ndarray'>

1 个答案:

答案 0 :(得分:0)

Gordon Mohr方向,我发现键值对存储在model.index2word中。

因此,可以使用以下方法轻松获取键值对列表:

lab=model.index2word