创建word2vec模型syn1neg.npy扩展名

时间:2017-04-24 12:37:39

标签: python python-3.x deep-learning word2vec doc2vec

创建模型时,不再有任何扩展完成的模型

  

.syn1neg.npy

     

syn0.npy

我的代码如下:

corpus= x+y
tok_corp= [nltk.word_tokenize(sent.decode('utf-8')) for sent in corpus]
model = gensim.models.Word2Vec(tok_corp, min_count=1, size = 32)
model.save('/home/Desktop/test_model')

model = gensim.models.Word2Vec.load('/home/kafein/Desktop/chatbot/test_model')

只有一个模型文件

test_model

哪个部分我错了?

1 个答案:

答案 0 :(得分:11)

Gensim的原生.save()只会将模型的某些部分保存到这些单独的文件中(如test_model.syn1neg.npy等),如果它们大于某个阈值。当它们很小时,它们会被“腌制”到单个模型保存文件中。

所以这里没有问题/错误。如果您开始使用更多单词训练更大的模型,您可能会看到其他文件重新出现。 (如果这样做,请务必将它们与主test_model文件放在一起,如果将其复制/移动到其他位置 - 需要将所有文件放在一起 - 重新load()模型。)