标签: machine-learning nlp gensim
此处提供了英语和其他语言维基百科的预训练模型...
https://wikipedia2vec.github.io/wikipedia2vec/pretrained/
如果是英语维基百科,则100d和500d有什么区别?
这些参数对训练意味着什么(窗口= 5,迭代= 10,负= 15)
答案 0 :(得分:0)
值100d,500d表示单词嵌入维度,请参见Word2Vec,词汇是由唯一单词构成的,每个单词都以给定嵌入维度的矢量形式嵌入。
5的窗口将参考n-gram模型,其中采用5个字的窗口来确定上下文。
我不确定迭代和否定。