我从我的代码中获取了单词向量。例如,
array([ -3.09521449e-04, 2.73033947e-06, 2.15601496e-04, ...,
5.12349070e-04, 5.04256517e-04, 8.16784304e-05], dtype=float32)
现在,我想确定在wor2vec genism中代表这个单词向量的单词是什么。
我使用下面的代码尝试了它。然而它没有用。
print(model.wv.index2word(kmeans_clustering.cluster_centers_))
请帮帮我。
答案 0 :(得分:0)
gensim most_similar()
方法也会将一个向量作为参数,但是你必须明确地将它作为一个项目提供在positive
示例列表中 - 这样它就不会被误解为别的。
例如:
wv = model.wv.['book']
similars = model.wv.most_similar(positive=[wv,])
自然地,'book'将位于与其自身向量最相似的单词列表的顶部。