应用错误收集

我正在尝试翻译以下前馈DNN

FUNCSTUFF()

进入具有三个LSTM层和三个输出o0，o1，o2的RNN，这三个层应该是三个密集层。

RNN输入大小为（10,70,1025 * 3）（对于前馈DNN略有变化，但相同的数据相同），而每个输出的大小为（10,70,1025）

我尝试创建三个LSTM层，并使用一个使用TimeDistributed函数的亚神经网络（此处称为子网）。

由于难以实现TimeDistributed函数，我认为通过分割长的密集层来获得三个输出层是一个好主意，如下所示：

myInt_lib1

尽管RNN训练运行顺利，但成本函数的下降速度比使用简单前馈的情况要慢得多，这使我认为我的实现尝试可能很差。有什么建议吗？