最类似于多个单词的手套

时间:2018-11-13 13:10:22

标签: python nlp gensim glove

我应该用python手套做一些练习,大多数都不会给我带来任何问题,但是现在我应该从“ glove-wiki”中找到与“挪威-战争+和平”最相似的5个词-gigaword-100“封装。但是当我运行代码时,它只是说“单词”不在词汇表中。现在,我猜测这是某种格式,但我不知道如何使用它。

import gensim.downloader as api
model = api.load("glove-wiki-gigaword-100")  # download the model and return as object ready for use

bests = model.most_similar("norway - war + peace", topn= 5)

print("5 most similar words to 'norway - war + peace':")

for best in bests:
    print(best)

1 个答案:

答案 0 :(得分:0)

Gensim的模型word2vec仅处理以前看到的单词。在这里您要给出一整个句子...您要做的是:

  1. 获取向量v1,v2和v3作为响应。单词“挪威”,“战争”和“和平”。
  2. 计算数学:v = v1-v2 + v3。
  3. 获取与v最相似的词。

要这样做,您将需要以下功能:model.wv.most_similar()model.wv.similar_by_vector()。请注意,model.wv.most_similar()的操作与这三个步骤相似,但使用一组肯定词和一组否定词的方式更为复杂。有关详细信息,请参见documentation