使用SimLex-999和Wordsim评估word2vec-关键错误

时间:2019-12-20 12:57:26

标签: nlp word2vec word-embedding evaluate

在尝试用意大利语评估我的Word2Vec模型时遇到一个奇怪的问题。 我正在使用此数据http://www.leviants.com/ira.leviant/MultilingualVSMdata.html

我遇到此错误`

context

现在奇怪的是,“ di”一词既不在我的词汇表中,也不在我的txt文件中。怎么了我认为这是一个分隔符问题,尝试了tsv,并尝试给出了参数 model.wv.evaluate_word_pairs(pairs= "...MWS353_Italian_tab.txt") Traceback (most recent call last): File "<stdin>", line 1, in <module> File "C:\ProgramData\Anaconda3\lib\site-packages\gensim\models\keyedvectors.py", line 1281, in evaluate_word_pairs ok_vocab = [(w, self.vocab[w]) for w in self.index2word[:restrict_vocab]] File "C:\ProgramData\Anaconda3\lib\site-packages\gensim\models\keyedvectors.py", line 1281, in <listcomp> ok_vocab = [(w, self.vocab[w]) for w in self.index2word[:restrict_vocab]] KeyError: 'di',但没有任何改变。

有什么办法解决这个问题吗?

0 个答案:

没有答案