我希望这能成为R中各种时间序列突破/变化/干扰检测方法的标志。我的问题是用以下每个包描述方法的动机和差异。也就是说,何时使用一种方法比另一种方法,相似性/差异等更有意义。
有问题的套餐:
我希望有针对性的答案。也许是每种方法的一个段落。在一个时间序列中很容易拍打每一个,但这可能会以滥用/违反假设为代价。有资源为ML监督/无监督技术提供指导。我(当然还有其他人)会欣赏这个时间序列分析领域的一些指南/指针。
答案 0 :(得分:14)
两种截然不同的动机导致了时间序列分析:
当然,在趋势分析之前,两者在很大程度上都是同一枚硬币的两面,并且检测异常值对于时间序列清理非常重要。不过,我将在此后尝试使用这种区别作为红线来解释R提供的用于研究时间序列的包的多样性。
在质量控制中,平均值和标准差的稳定性非常重要,如history of one of the first statistical efforts to maintain industrial quality, the control chart所示。在这方面,qcc是most classical quality control diagrams: Shewhart quality control, cusum and EWMA charts的参考实现。
旧的但仍然有效的mvoutlier以及最近AnomalyDetection关注离群值检测。 mvoutlier主要使用Mahalanobis距离,可以使用Filzmoser,Maronna和Werner(2007)的算法处理二维数据集(栅格)甚至多维数据集。 AnomalyDetection使用time series decomposition来识别局部异常(outlyers)和全局异常(不受季节性模式解释的变化)。 和BreakoutDetection
作为AnomalyDetection,BreakoutDetection已于2014年由Twitter开源。BreakoutDetection,open-sourced in 2014 by Twitter,打算检测突破时间序列,即异常组,使用非参数统计。突破的检测非常接近于趋势的检测和对模式的理解。在类似的光学元件中,brca一揽子计划侧重于对不规则采样时间序列的分析,尤其是识别behavioral changes in animal movement。
绝对转向确定趋势的变化 changepoint实现多个(简单)频率和非参数方法,以检测时间序列趋势中的单个或多个中断。 strucchange允许使用回归模型拟合,绘制和测试趋势变化。最后,bfast建立在strucchange之上,用于分析栅格(例如卫星图像)时间序列并处理丢失的数据。