在尝试用意大利语评估我的Word2Vec模型时遇到一个奇怪的问题。 我正在使用此数据http://www.leviants.com/ira.leviant/MultilingualVSMdata.html
我遇到此错误`
context
现在奇怪的是,“ di”一词既不在我的词汇表中,也不在我的txt文件中。怎么了我认为这是一个分隔符问题,尝试了tsv,并尝试给出了参数 model.wv.evaluate_word_pairs(pairs= "...MWS353_Italian_tab.txt")
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "C:\ProgramData\Anaconda3\lib\site-packages\gensim\models\keyedvectors.py", line 1281, in evaluate_word_pairs
ok_vocab = [(w, self.vocab[w]) for w in self.index2word[:restrict_vocab]]
File "C:\ProgramData\Anaconda3\lib\site-packages\gensim\models\keyedvectors.py", line 1281, in <listcomp>
ok_vocab = [(w, self.vocab[w]) for w in self.index2word[:restrict_vocab]]
KeyError: 'di'
,但没有任何改变。
有什么办法解决这个问题吗?