gensim word2vec中随机选择向量

时间:2018-08-08 08:45:59

标签: python-3.x nlp gensim word2vec word-embedding

我使用gensim训练了word2vec模型,我想从中随机选择向量,然后找到相应的词。 最好的做法是什么?

2 个答案:

答案 0 :(得分:0)

如果您的Word2Vec模型实例位于变量model中,那么model.wv.index2word中将包含该模型已知的所有单词的列表。 (属性与旧版gensim略有不同。)

因此,您可以在choice()模块中使用Python内置的random方法选择一项:

import random
print(random.choice(model.wv.index2entity) 

答案 1 :(得分:0)

如果您想使用 Gensim 4.0.0 从 word2vec 中获取 n 个随机单词(键),只需使用 random.sample

import random
import gensim
# Here we use Gensim 4.0.0
w2v = gensim.models.KeyedVectors.load_word2vec_format("model.300d")
# Get 10 random words (keys) from word2vec model
random_words = random.sample(w2v.index_to_key, 10)
print("Random words: "+ str(random_words))

一块蛋糕:)