作为在~1GB语料库上创建Word2Vec模型的输出我得到3个文件作为输出:
我以前只有第一个文件(训练较小的语料库时)。
加载模型时如何处理最后2个文件? 我应该只加载第一个并像往常一样对它运行查询吗?
答案 0 :(得分:0)
当gensim模型的内部数组超出某个阈值时,它们将save()
作为单独的文件,以提高效率并避免限制普通 - pickle()
。
您应该将这些文件与主文件放在一起 - 例如将它们与主文件一起移动。但您只需要load()
主文件名 - 您最初提供给save()
的名称。然后它会自动找到子文件。