使用手套中的训练数据为您的数据集获取单词嵌入

时间:2017-12-26 06:19:40

标签: python macos nlp

我最近在我的mac中安装了gensim和手套,并试图为我拥有的文本数据进行单词嵌入。但是,我找不到合适的功能。我只是遇到了获取两个单词之间相似度量的方法。如何使用库中存在的数据训练手套对象并使用它来获取我的数据集中的单词的嵌入?或者python中还有其他库可以执行此操作吗?谢谢!

1 个答案:

答案 0 :(得分:0)

实际上,手套的格式与word2vec不同,您可以使用此https://radimrehurek.com/gensim/scripts/glove2word2vec.html

将手套的格式转换为word2vec格式

让转换的手套是glove_changed.txt

import gensim model = gensim.models.KeyedVectors.load_word2vec_format('glove_changed.txt', binary=False) print(model['cat']) // This will give the wordvector for the word 'cat'