问候大家!
我想问一下一般中是否存在 LSTM网络的最佳序列长度,或者是否存在时间序列预测问题?
我了解了很长的RNN网络和LSTM试图解决并在一定程度上取得成功的消失梯度或爆炸梯度的问题。
我还听说过使用LSTM和RNN处理大型序列的技术,例如:截断序列,汇总序列,截断反向传播,甚至使用Encoder-Decoder架构。
我之所以问这个问题,是因为我没有找到有关此问题的研究论文,只有这份blog post声明了序列长度在10-30之间的最佳
谢谢!
祝你有美好的一天!
答案 0 :(得分:1)
TLDR:。只需尝试一下。
由于训练已经在计算上非常昂贵,因此计算模型成功的最简单方法是对其进行测试。不能容易地预先确定最有效的组合,尤其是在没有这样模糊的描述(或根本没有描述)的情况下。
来自this answer:
这完全取决于数据的性质和内部相关性,没有经验法则。但是,鉴于您拥有大量数据,两层LSTM可以对大量时间序列问题/基准进行建模。
因此,在您的情况下,您可能想尝试10到30之间的序列长度。但是,我还将尝试通过链接的帖子来评估训练算法在建议值之外的效果。