我不明白为什么图层中的单位数被用作seq2seq模型中输出投影的参数。具体来说,这是让我感到困惑的代码(https://github.com/tensorflow/models/blob/master/tutorials/rnn/translate/seq2seq_model.py中的第98行)
w_t = tf.get_variable("proj_w", [self.target_vocab_size, size], dtype=dtype)
此处,尺寸是模型每层中的单位数。为什么?
我认为它应该是num_samples(最常见的是,size和num_samples都是512)。但是,当我尝试将num_samples设置为500,并将大小设置为512并运行训练时,它会抱怨维度不匹配。
有人可以帮我理解这个吗?提前谢谢。