What is the difference between RNNs and LSTMs and when do we use either of these models?
答案 0 :(得分:0)
不完全是。 RNN,递归神经网络可以很好地完成某些任务,但是由于使用RNN会引起一些问题,例如“爆炸梯度”或“消失梯度问题”,因此使用LSTM成为了标准,这是解决这些问题的一种RNN。
当您通过一个较长的网络反向传播时,会发生爆炸/消失的梯度,并且由于您不断增加梯度,因此它可能会增长并溢出,或者变得非常小而没有梯度。效果了。
LSTM通过使用称为门控循环单元的机制解决了这一问题。由于LSTM解决了标准RNN通常遇到的问题,因此更广泛地使用LSTM。对您来说,理解这些主题实际上很重要,因此我将看一下此博客,它通过图形和示例完美地解释了它们。 https://skymind.ai/wiki/lstm