如何通过过滤掉一些单词来加速Gensim Word2vec模型?

时间:2017-05-16 15:44:17

标签: word2vec

假设我在列表中过滤了我想在下一个word2vec模型加载中使用的单词。如何构建我自己的仅包含这些已过滤的单词列表的KeyedVectors?

我试图制作:

w2v_model_keyed = w2v_model.wv
w2v_model_keyed.drop(word)

对于给定的单词但我收到以下错误:

 AttributeError: 'KeyedVectors' object has no attribute 'drop'

谢谢

1 个答案:

答案 0 :(得分:0)

gensim KeyedVectors类不支持增量扩展或修改(与.drop()方法一样)。您需要构建一个具有正确大小/内容的新实例。

您应该查看gensim KeyedVectors source code,尤其是.load_word2vec_format() method,以了解如何在gensim中创建现有实例,并模仿创建一个只需要您需要的大小/单词的实例。