连接两个doc2vec模型:矢量尺寸加倍

时间:2018-02-08 10:18:26

标签: machine-learning concatenation word2vec gensim doc2vec

我有一个关于连接两个doc2vec模型的问题。我按照doc2vec上的official gensim IMDB example执行了示例数据。

当连接两个模型(PV-DM + PV-DBOW)时,如原始论文中所述,我想知道连接模型看起来没有200维,就像两个输入模型一样,但是400-dim:< / p>

Shape Train(11948, **400**)
Shape Test(2987, **400**)

输入形状分别为:

np.asarray(X_train).shape)
(11948, **200**)
(2987, **200**)

这是正确的吗?我预计维度的数量会再次为200。

1 个答案:

答案 0 :(得分:1)

这是对的。 PV-DMPV-DBOW是两个不同的模型,每个模型都会生成维度dim的不同嵌入,其中dim=200位于您的情况下。因此,当连接维度应该加倍时。