如何使用gensim工具包找到单词或多词释义的同义词

时间:2018-05-05 15:44:52

标签: python nlp word2vec gensim word-sense-disambiguation

在使用gensim工具包加载预先训练过的word2vec模型之后,我想找到一个给出上下文的单词的同义词,例如聪明的“她是一个聪明的人”。

1 个答案:

答案 0 :(得分:1)

有一种方法[most_similar()][1]可以通过模型坐标中的余弦相似性将最接近的矢量的单词报告给给定的单词。例如:

similars = loaded_w2v_model.most_similar('bright')

但是,Word2vec不会发现严格的同义词 - 只是在其训练语料库中与语境相关的词语。这些通常是同义词,但也可以在其他方面类似 - 例如在相同的主题域中使用,或者能够在功能上相互替换。 (在最后一个方面,有时高度相似的单词向量用于反义词,因为像'hot'和'cold'这样的单词出现在同一个地方,指的是某些东西的相同方面。)

普通的word2vec也不涉及多义词(像'明亮'这样的标记既是'光照良好'也是'聪明'的单词)。因此,“明亮”中最相似的单词列表将包括来自其替代意义的混合。