在论文“Grid Long Short-Term Memory”中,作者描述了翻译模型(第4.4节)。我的第一印象是这个模型被认为是一个3-D网格LSTM模型,因为它由两个堆叠在彼此顶部的2-D网格组成,即两个层。然后,我读到这个:“3-LSTM使用两个二维网格的3-LSTM块用于层次结构”和#34;注意,第二个网格接收来自下面每个3-LSTM块的网格的输入& #34 ;.这是否意味着二维网格由三维LSTM组成?在介绍中,他们说N-LSTM是N维网格LSTM的较短符号。
这是他们模特的数字:
但是我想知道下一个数字是否可以根据上面的信息更好地代表模型(只需更少的图层):
我使用的是Tensorflow,我使用MultiRNNCell将两个Grid2LSTMCell堆叠在一起。但现在我认为我应该使用Grid3LSTMCell ..任何评论或想法? :)