我是ML和数据科学的初学者。我在查找多个时间序列中的异常方面有一个难题任务,需要注意的是,整个时间序列在许多这样的时间序列中都被视为异常值。 我正在使用Python和Keras LSTM库处理这些数据,并将每个时间序列存储在一个数据框中,并创建一个包含所有此类数据框的数据框。
这里的问题是,我没有任何训练数据或有关哪个时间序列本质上是异常的信息。我只有很少的一组时间序列,大约只有30个这样的时间序列(但是每个数据帧的时间步长都超过8000个)。我尝试阅读LSTM,并检查了LSTM在时间序列异常检测中的一些现有用法,但是它们都有
a)他们训练LSTM预测方法的单个时间序列
b)一个单独的训练LSTM网络的训练数据集,然后使用该模型查找异常
我想到的一个想法是在所有序列上拟合一个自动编码器模型,然后在相同序列上再次运行它,然后发现重构错误。我担心的是,只有几个时间序列,LSTM也会在异常序列上训练,并且效果不佳。 是否有任何资源可以通过Python实现指导我如何在没有任何明确定义的训练和测试数据的情况下对此类数据集进行异常检测?