gensim doc2vec中的size参数代表什么

时间:2016-06-16 14:18:53

标签: gensim doc2vec

doc2vec function中,有一个名为size的参数。

我理解,size是输出向量的维度,如果size=400它将比size=100更好地捕获内容。

但是,我不明白,size代表什么?这是否意味着Doc2Vec将从一个单词中查找到多远,以预测下一个单词?或者它是什么意思?

非常感谢,

1 个答案:

答案 0 :(得分:1)

size是创建的向量中的维数。所以size=100表示每个文档(实际上是文档标记)从训练中接收100维向量。

更多尺寸并不总是更好:它们意味着更慢的训练和更大的模型。如果您正在处理一个小型数据集,那么过多的维度会过度拟合 - 这会阻止模型在数据中表示可推广的模式。