Question

我从我的代码中获取了单词向量。例如，

array([ -3.09521449e-04,   2.73033947e-06,   2.15601496e-04, ...,
         5.12349070e-04,   5.04256517e-04,   8.16784304e-05], dtype=float32)

现在，我想确定在wor2vec genism中代表这个单词向量的单词是什么。

我使用下面的代码尝试了它。然而它没有用。

print(model.wv.index2word(kmeans_clustering.cluster_centers_))

请帮帮我。

Answer 1

gensim most_similar()方法也会将一个向量作为参数，但是你必须明确地将它作为一个项目提供在positive示例列表中 - 这样它就不会被误解为别的。

例如：

wv = model.wv.['book']
similars = model.wv.most_similar(positive=[wv,])

自然地，'book'将位于与其自身向量最相似的单词列表的顶部。