gensim模型KeyError

时间:2017-12-03 23:53:47

标签: python gensim

我不明白为什么培训后的gensim模型词汇中没有单词

model = gensim.models.Word2Vec(sentences, min_count=1, size=200, iter=1)
print "AMBER" in sentences
vec = model.wv["AMBER"]
print vec

给出以下

Traceback (most recent call last):
  File "model.py", line 38, in <module>
    vec = model.wv["AMBER"]
  File "/Users/nadiia/miniconda2/lib/python2.7/site-packages/gensim/models/keyedvectors.py", line 601, in __getitem__
    return self.word_vec(words)
  File "/Users/nadiia/miniconda2/lib/python2.7/site-packages/gensim/models/keyedvectors.py", line 288, in word_vec
    raise KeyError("word '%s' not in vocabulary" % word)
KeyError: "word 'AMBER' not in vocabulary"

我不明白为什么...... 我专门运行这个模型来学习列表句子中每个单词的嵌入,但是我在模型的词汇表中找不到任何单词。我不能得到任何嵌入。

它有什么问题?

由于

编辑: 这有助于解决问题

text = [nltk.word_tokenize(sent.decode("utf-8")) for sent in sentences]

0 个答案:

没有答案