在doc2vec
function中,有一个名为size
的参数。
我理解,size
是输出向量的维度,如果size=400
它将比size=100
更好地捕获内容。
但是,我不明白,size
代表什么?这是否意味着Doc2Vec将从一个单词中查找到多远,以预测下一个单词?或者它是什么意思?
非常感谢,
答案 0 :(得分:1)
size
是创建的向量中的维数。所以size=100
表示每个文档(实际上是文档标记)从训练中接收100维向量。
更多尺寸并不总是更好:它们意味着更慢的训练和更大的模型。如果您正在处理一个小型数据集,那么过多的维度会过度拟合 - 这会阻止模型在数据中表示可推广的模式。