构建doc2Vec算法时,需要进行多次嵌入。单词向量有嵌入,同时文档本身也有嵌入。算法的工作方式类似于CBOW模型,但每个使用给定窗口训练的文档也使用文档嵌入。因此,如果我们有一个5个单词的窗口,我们继续浏览这5个单词,但是每个窗口我们将始终包含文档嵌入向量本身,以便我们可以更新它。
答案 0 :(得分:2)
简单地说:
input_tensor = tf.concat(1, [wordembedding_tensor, documentembedding_tensor])
然后输入张量就是你的输入。