在预训练的Google新闻载体上对word2vec进行再训练

时间:2018-08-27 18:45:41

标签: machine-learning nlp word2vec

我正在进行一项实验,我想知道是否有可能仅使用我想要的超参数来重新训练word2vec Google新闻向量。并将我想要的值分配给这些超参数。 谢谢

1 个答案:

答案 0 :(得分:0)

并非如此,因为他们尚未共享使用过的确切语料。

如果您更喜欢自己的语料库–因为它包含更多的单词,或者适合您的应用程序的单词感觉,或者仅仅是因为这是您唯一的拥有–您就不需要“重新训练”其他向量,您可以从头开始制作。

也许有一些方法可以将这些向量注入到模型中以“快速启动”,但这会增加复杂性,带来的好处尚不明确。如果您的语料库有任何好处,或者对您的目的而言可能比GoogleNews所用的语料库还要好,那么混合其中的影响可能会很复杂,没有任何净收益。