syn1neg& syn0创建为输出

时间:2018-01-02 11:46:41

标签: word2vec gensim

作为在~1GB语料库上创建Word2Vec模型的输出我得到3个文件作为输出:

  • word2vec_model
  • word2vec_model.syn1neg.npy
  • word2vec_model.wv.syn0.npy

我以前只有第一个文件(训练较小的语料库时)。

加载模型时如何处理最后2个文件? 我应该只加载第一个并像往常一样对它运行查询吗?

1 个答案:

答案 0 :(得分:0)

当gensim模型的内部数组超出某个阈值时,它们将save()作为单独的文件,以提高效率并避免限制普通 - pickle()

您应该将这些文件与主文件放在一起 - 例如将它们与主文件一起移动。但您只需要load()主文件名 - 您最初提供给save()的名称。然后它会自动找到子文件。