我只是在这里阅读并运行了代码:https://tomaxent.com/2017/04/26/LSTM-by-Example-using-Tensorflow-Text-Generate/
(此人剥夺了以下medium.com文章,但我无法从工作计算机访问medium.com); https://medium.com/towards-data-science/lstm-by-example-using-tensorflow-feb0c1968537
根据我以前的阅读,我的理解是,要训练RNN,我们必须将它们“解包”到前馈网络(FFN)中一定数量的步骤(以及在时间t的“ x”额外输入”,并进行设置,以使FFN中与RNN中的单个权重相对应的所有权重都相等。
我正在查看代码,但看不到任何“解包”步骤,甚至看不到指示我们要解包的步骤数的变量。
还有另一种训练RNN的方法吗?我只是在代码中缺少定义该变量的行吗?
答案 0 :(得分:0)
如果我没记错的话,就没有这样的“展开步骤”。我们通常会“展开” RNN,以了解其正常工作(在每个时间步长)。 现在,在Tensorflow实施中,我发现此仓库MuhammedBuyukkinaci/TensorFlow-Text-Generator非常有用,这可能会消除您的大部分疑问。
其他有用的链接: