When to use RNN or LSTM

时间:2019-04-27 12:24:41

标签: lstm seq2seq natural-language-processing

What is the difference between RNNs and LSTMs and when do we use either of these models?

1 个答案:

答案 0 :(得分:0)

不完全是。 RNN,递归神经网络可以很好地完成某些任务,但是由于使用RNN会引起一些问题,例如“爆炸梯度”或“消失梯度问题”,因此使用LSTM成为了标准,这是解决这些问题的一种RNN。

当您通过一个较长的网络反向传播时,会发生爆炸/消失的梯度,并且由于您不断增加梯度,因此它可能会增长并溢出,或者变得非常小而没有梯度。效果了。

LSTM通过使用称为门控循环单元的机制解决了这一问题。由于LSTM解决了标准RNN通常遇到的问题,因此更广泛地使用LSTM。

对您来说,理解这些主题实际上很重要,因此我将看一下此博客,它通过图形和示例完美地解释了它们。 https://skymind.ai/wiki/lstm