Gensim save_word2vec_format()与model.save()

时间:2017-05-18 14:48:51

标签: python nlp gensim word2vec

我正在使用gensim版本0.12.4,并使用相同的文本和相同的参数训练了两个单独的字嵌入。在训练之后,我正在计算单词出现频率和向量长度之间的Pearsons相关性。我使用save_word2vec_format(fname, binary=True)训练了一个模型,然后使用load_word2vec_format加载了我使用model.save(fname)训练的另一个模型,然后使用Word2Vec.load()加载。据我所知,word2vec算法是非确定性的,因此结果会有所不同,但两种模型之间的相关性差异非常大。在这种情况下我应该使用哪种方法?

1 个答案:

答案 0 :(得分:0)

编辑:这是作为评论。现在不知道如何改变它,抱歉

单词出现频率和向量长度之间的相关性我并不完全跟随 - 所有向量的长度是否相同?或者你不是指嵌入向量?