我正在网上寻找一种解释,但没有找到一种解释。让我们谈谈RNN的特定时间步。假设在这一点上我们有一个负输入,即x(t)=(-2,4,-4),并且我们还假设状态大小5为h(t-1)。对于输入门,此x(t)和h(t-1)给出一个输入向量8,该乘积与大小为8x5的输入门的权重矩阵相乘,最终得出大小为5的h(t)的新状态。理解,由于怀特矩阵的负输入乘法,h(t)的某些值可能变为负。现在,如果此负值通过激活传递(例如S型信号),难道不是将这些值设为零吗?因此,没有机会擦除输入信息吗?我刚刚提到了输入门,这对于所有门都是如此。我的问题是,将负输入保持原样还可以吗?还是明智的做法是在输入rnn / lstms之前对其进行一些正输入? 谢谢