我不明白为什么培训后的gensim模型词汇中没有单词
model = gensim.models.Word2Vec(sentences, min_count=1, size=200, iter=1)
print "AMBER" in sentences
vec = model.wv["AMBER"]
print vec
给出以下
真
Traceback (most recent call last):
File "model.py", line 38, in <module>
vec = model.wv["AMBER"]
File "/Users/nadiia/miniconda2/lib/python2.7/site-packages/gensim/models/keyedvectors.py", line 601, in __getitem__
return self.word_vec(words)
File "/Users/nadiia/miniconda2/lib/python2.7/site-packages/gensim/models/keyedvectors.py", line 288, in word_vec
raise KeyError("word '%s' not in vocabulary" % word)
KeyError: "word 'AMBER' not in vocabulary"
我不明白为什么...... 我专门运行这个模型来学习列表句子中每个单词的嵌入,但是我在模型的词汇表中找不到任何单词。我不能得到任何嵌入。
它有什么问题?
由于
编辑: 这有助于解决问题
text = [nltk.word_tokenize(sent.decode("utf-8")) for sent in sentences]