我有以下数据集 用于炼油厂的化学过程。它由5x5输入向量组成,其中每个向量在每分钟被采样。输出是整个过程的结果,每5分钟采样一次。
我得出结论,输出(黄色)很大程度上取决于过去的输入向量。最近看了LSTM并尝试在Python和Torch上学习它们。
但是我不知道如何以我的LSTM可以处理它的方式准备我的数据集,并在使用新的输入向量进行测试时显示未来的预测。
是否有直接的方式来相应地预处理我的数据集?
EDIT1:事实上,我发现了这个关于自然语言处理LSTM培训的博客http://karpathy.github.io/2015/05/21/rnn-effectiveness/。简而言之,LSTM将角色作为输入并尝试生成下一个角色。最终,它可以训练莎士比亚诗歌,以产生新的莎士比亚诗歌!但建议使用GPU加速。
EDIT2:基于EDIT1,格式化数据集的最佳方法是将我的excel转换为带有TAB分隔列的txt。我会尽快在上面的数字数据集上发布LSTM预测的结果。