为什么在TensorFlow的seq2seq模型的out投影中使用了单位数?

时间:2017-06-21 16:12:58

标签: python tensorflow

我不明白为什么图层中的单位数被用作seq2seq模型中输出投影的参数。具体来说,这是让我感到困惑的代码(https://github.com/tensorflow/models/blob/master/tutorials/rnn/translate/seq2seq_model.py中的第98行)

w_t = tf.get_variable("proj_w", [self.target_vocab_size, size], dtype=dtype)

此处,尺寸是模型每层中的单位数。为什么?

我认为它应该是num_samples(最常见的是,size和num_samples都是512)。但是,当我尝试将num_samples设置为500,并将大小设置为512并运行训练时,它会抱怨维度不匹配。

有人可以帮我理解这个吗?提前谢谢。

0 个答案:

没有答案