尝试使用预训练的俄语语言模型。从 https://wikipedia2vec.github.io/wikipedia2vec/pretrained/
但是无法从pkl文件加载模型。 尝试将其他编码器用作cp1251,latin1,windows-1252。不幸的是,它掉落了。
model = Word2Vec.load_word2vec_format('ruwiki_20180420_100d.pkl')
UnpicklingError: invalid load key, '`'
答案 0 :(得分:0)
根据您引用的页面上的文本https://wikipedia2vec.github.io/wikipedia2vec/pretrained/,此处的二进制文件应加载Wikipedia2Vec.load()
。
只有带有后缀.txt
的其他文本文件才能使用gensim
的{{1}}方法加载。
对您提到的文件使用load_word2vec_format()
,或者尝试使用文本文件变体。