给定一个单词向量在word2vec中得到它的单词

时间:2017-11-07 10:21:24

标签: python word2vec gensim word-embedding doc2vec

我从我的代码中获取了单词向量。例如,

array([ -3.09521449e-04,   2.73033947e-06,   2.15601496e-04, ...,
         5.12349070e-04,   5.04256517e-04,   8.16784304e-05], dtype=float32)

现在,我想确定在wor2vec genism中代表这个单词向量的单词是什么。

我使用下面的代码尝试了它。然而它没有用。

print(model.wv.index2word(kmeans_clustering.cluster_centers_))

请帮帮我。

1 个答案:

答案 0 :(得分:0)

gensim most_similar()方法也会将一个向量作为参数,但是你必须明确地将它作为一个项目提供在positive示例列表中 - 这样它就不会被误解为别的。

例如:

wv = model.wv.['book']
similars = model.wv.most_similar(positive=[wv,])

自然地,'book'将位于与其自身向量最相似的单词列表的顶部。