平均多个模型Word2vec Gensim

时间:2015-06-03 19:07:00

标签: python python-2.7 gensim word2vec

我在Word2Vec的{​​{1}} Python中训练了几百万字。我想用新数据更新这个训练有素的模型。 但是从你以前的帖子和网络上的其他来源我发现这是不可能的。 所以我试图创建多个模型并转储它们。现在我想合并我倾倒的模型。我想使用这些倾销结果。我收到了上一篇文章Merging pretrained models in Word2Vec? 但我没有得到如何做到这一点。我开始知道有一个名为deepdist的图书馆,我试图看一些实验:

Gensim
  1. 有可能的解决方案吗?
  2. 如果有的话,可以建议怎么做?
  3. 我在Windows 7 Professional上使用Python2.7。

1 个答案:

答案 0 :(得分:1)

您指出的答案并未建议将模型合并为解决方案。实际上,他们建议您分别使用不同的型号。使用每个模型进行预测,然后合并答案。有几种方法可以组合输出。在你的情况下,你提到你有几个模型,所以你可以忽略那个答案的部分,他们建议在2中打破你的训练数据,以便实际有3个模型投射预测。只要您有超过2个预测,就可以使用多数表决政策。