我不确定LSTM中num_units的含义。
https://jasdeep06.github.io/posts/Understanding-LSTM-in-Tensorflow-MNIST/
有人可以帮助解释使用以下博客中的符号的内容吗?
答案 0 :(得分:0)
LSTM的主要特征是在步骤之间转换的状态。这个状态是LSTM的内存,它可以改变输入的效果,可以通过输入和先前的输出来改变。The Core Idea Behind LSTMs
部分描述了这个概念。这个向量的大小非常重要。因此,由uppercase W
命名的所有矩阵的维度都受LSTM内存大小的影响,因为它们的任务是数据转换并控制内存和其他值之间的相互作用。