我应该用python手套做一些练习,大多数都不会给我带来任何问题,但是现在我应该从“ glove-wiki”中找到与“挪威-战争+和平”最相似的5个词-gigaword-100“封装。但是当我运行代码时,它只是说“单词”不在词汇表中。现在,我猜测这是某种格式,但我不知道如何使用它。
import gensim.downloader as api
model = api.load("glove-wiki-gigaword-100") # download the model and return as object ready for use
bests = model.most_similar("norway - war + peace", topn= 5)
print("5 most similar words to 'norway - war + peace':")
for best in bests:
print(best)
答案 0 :(得分:0)
Gensim的模型word2vec仅处理以前看到的单词。在这里您要给出一整个句子...您要做的是:
要这样做,您将需要以下功能:model.wv.most_similar()
和model.wv.similar_by_vector()
。请注意,model.wv.most_similar()
的操作与这三个步骤相似,但使用一组肯定词和一组否定词的方式更为复杂。有关详细信息,请参见documentation。