维基百科模型训练参数

时间:2018-12-27 07:24:25

标签: machine-learning nlp gensim

此处提供了英语和其他语言维基百科的预训练模型...

https://wikipedia2vec.github.io/wikipedia2vec/pretrained/

如果是英语维基百科,则100d和500d有什么区别?

这些参数对训练意味着什么(窗口= 5,迭代= 10,负= 15)

1 个答案:

答案 0 :(得分:0)

值100d,500d表示单词嵌入维度,请参见Word2Vec,词汇是由唯一单词构成的,每个单词都以给定嵌入维度的矢量形式嵌入。

5的窗口将参考n-gram模型,其中采用5个字的窗口来确定上下文。

我不确定迭代和否定。