我正在尝试为我拥有的seq2seq模型创建一个解码器。 到目前为止我所拥有的是:
dec_op_reshaped = tf.reshape(decoder_outputs, [-1, state_size])
logits = tf.matmul(dec_op_reshaped, V) + bo
feed_dict = {
self.xs_ : query,
self.dec_inputs_length_ : [query.shape[-1]*2], # this bothers me!
self.keep_prob_ : 1.
}
translated_arr = self._sess.run(tf.argmax(tf.nn.softmax(logits), axis=1), feed_dict = feed_dict)
我不知道我做错了什么,但每次传递一个查询时,它都会返回一个零数组而不是idx2w(预期的结果)。
编辑: 我很抱歉。有时它就在你面前而你却错过了它。 状态大小为0 - 因此问题。