标签: memory model lstm recurrent-neural-network layer
我被要求在模型中实现关注层,以便考虑长期依赖关系,但是当LSTM本身具有关注机制时,为什么需要它。