Question

在尝试用意大利语评估我的Word2Vec模型时遇到一个奇怪的问题。我正在使用此数据http://www.leviants.com/ira.leviant/MultilingualVSMdata.html

我遇到此错误`

context

现在奇怪的是，“ di”一词既不在我的词汇表中，也不在我的txt文件中。怎么了我认为这是一个分隔符问题，尝试了tsv，并尝试给出了参数model.wv.evaluate_word_pairs(pairs= "...MWS353_Italian_tab.txt") Traceback (most recent call last): File "<stdin>", line 1, in <module> File "C:\ProgramData\Anaconda3\lib\site-packages\gensim\models\keyedvectors.py", line 1281, in evaluate_word_pairs ok_vocab = [(w, self.vocab[w]) for w in self.index2word[:restrict_vocab]] File "C:\ProgramData\Anaconda3\lib\site-packages\gensim\models\keyedvectors.py", line 1281, in <listcomp> ok_vocab = [(w, self.vocab[w]) for w in self.index2word[:restrict_vocab]] KeyError: 'di'，但没有任何改变。

有什么办法解决这个问题吗？

使用SimLex-999和Wordsim评估word2vec-关键错误

0 个答案: