我将有一个设备,可以测量每个特定时间间隔的温度值。
我想训练一个模型来了解哪些值不属于“正常”值,如果是,则提出警报。所以,我想要一个异常的时间序列检测模型。
起初,我想过使用一个聚类模型(kmeans,层次结构)。所以,在开始的时候,我会有很多警报。后来,会创建一些集群,希望我会有一个好的模型! / p>
但是,由于我对此没有任何经验,我想问这种方法是否正确或存在其他方法。我应该使用什么样的工具(要么是Python R)。
我已经阅读了很多链接和一些论文,我可以看到有些人不建议使用kmeans do not use k means。
此外,我不确定如何/是否使用动态时间扭曲聚类。
我读了一篇论文Clustering of Time Series Subsequences is Meaningless,其中指出在某些条件下应用聚类是没有意义的。
我也看到了tsouliers package,twitter's anomaly detection,但我不确定我说的应该使用哪种方法/工具。
答案 0 :(得分:0)
我也试图让异常检测工作。我开始使用ARMA模型来解决这个问题,但他们有很多误报。所以我想尝试使用PCA。想法是使用PCA组件来近似函数。我通过这个link得到了这个想法。希望这会对你有所帮助。当我完全实现它时,将更新以更好地回答。