从R中的时间序列中删除前导零

时间:2014-02-17 09:25:51

标签: r time-series forecasting

我有以下模式的时间序列,我想知道是否有人可以分享一个聪明的技巧来删除前导零。我想避免的原因是它可能对预测模型的选择产生负面影响。

时间序列示例:

TimeSeries <- ts(c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 
                   0, 0, 0, 0, 0, 0, 9, 10, 10, 16, 7, 13, 0, 9, 1, 
                   11, 2, 11, 3, 11, 4, 1, 20, 13, 18, 19, 16, 16, 16, 
                   15, 14, 27, 24, 35, 8, 18, 21, 20, 19, 22, 18, 21
),start=c(2001,6),frequency=12)

我可以想象一个缩小前导零序列的过程,使用时间序列的子集执行多个测试,然后仅使用零删除前导子集。然而,这将是麻烦的过程,其在计算方面可能是低效的。

是否有人知道现有的功能或程序有效地执行此操作?

2 个答案:

答案 0 :(得分:5)

这只删除了其他零中的前导零和叶子:

TimeSeries[cumsum(TimeSeries)!=0]
#[1]  9 10 10 16  7 13  0  9  1 11  2 11  3 11  4  1 20 13 18 19 16 16 16 15 14 27 24 35  8 18 21 20 19 22 18 21

为什么这样做? cumsum的输出是:

cumsum(TimeSeries)
 [1]   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   9  19  29  45  52  65  65  74  75
[33]  86  88  99 102 113 117 118 138 151 169 188 204 220 236 251 265 292 316 351 359 377 398 418 418 437 459 477 498

因此,仅在仅存在零的情况下,结果等于零。如果在时间序列中途的某处有零,则cumsum不会改变但不会为零。

如果时间序列中有负值,您可以使用:

TimeSeries[cumsum(abs(TimeSeries))!=0]

答案 1 :(得分:1)

TimeSeries[TimeSeries != 0] ...对我有用,可能是更好的方式,但是:

> TimeSeries <- ts(c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 
                   0, 0, 0, 0, 0, 0, 9, 10, 10, 16, 7, 13, 0, 9, 1, 
                   11, 2, 11, 3, 11, 4, 1, 20, 13, 18, 19, 16, 16, 16, 
                   15, 14, 27, 24, 35, 8, 18, 21, 20, 19, 22, 18, 21
),start=c(2001,6),frequency=12)
> TimeSeries[TimeSeries != 0]
 [1]  9 10 10 16  7 13  9  1 11  2 11  3 11  4  1 20 13 18 19 16 16 16 15 14 27
[26] 24 35  8 18 21 20 19 22 18 21
>

希望有所帮助!