应用错误收集

在预训练的Google新闻载体上对word2vec进行再训练

时间：2018-08-27 18:45:41

标签： machine-learning nlp word2vec

我正在进行一项实验，我想知道是否有可能仅使用我想要的超参数来重新训练word2vec Google新闻向量。并将我想要的值分配给这些超参数。谢谢

1 个答案:

答案 0 :(得分：0)

并非如此，因为他们尚未共享使用过的确切语料。

如果您更喜欢自己的语料库–因为它包含更多的单词，或者适合您的应用程序的单词感觉，或者仅仅是因为这是您唯一的拥有–您就不需要“重新训练”其他向量，您可以从头开始制作。

也许有一些方法可以将这些向量注入到模型中以“快速启动”，但这会增加复杂性，带来的好处尚不明确。如果您的语料库有任何好处，或者对您的目的而言可能比GoogleNews所用的语料库还要好，那么混合其中的影响可能会很复杂，没有任何净收益。