tensorflow:如何将张量的第i个索引作为输入传递给完全连接的层?

时间:2018-08-17 07:01:28

标签: tensorflow

在tensorflow中使用注意力的一种方法是直接使用tf.contrib.seq2seq.LuongAttentiontf.contrib.seq2seq.BahdanauAttention

但是,当我的注意力取决于编码器的隐藏状态和解码器的输出时,情况几乎不会变得混乱。

我正在尝试使用https://arxiv.org/pdf/1705.02012.pdf(第3.2节)中给出的注意。

等式是:

其中h代表编码器的隐藏状态,d代表文档,a代表答案,y代表解码器的输出,s代表解码器的隐藏状态。 f是前馈神经网络。

如果我已经知道h的值,我就可以一一传递给feed_dict的{​​{1}}。但是这里需要创建一个图。

我可以做的一种方法是:

sess.run
对于h_d的每个 jth 索引

,但是就内存而言,这是非常昂贵的。

如何在创建图形本身时将张量的 jth 值传递给tf.contrib.layers.fully_connected(tf.concat((h_d[:,j,:], h_a, yt_1, st_1), 1),...) ?还是有更好的方法呢?

0 个答案:

没有答案