尝试在R中使用stl和分解函数时出错

时间:2014-01-14 20:12:29

标签: r time-series forecasting

我制作了一个简单的时间序列,我给sin函数添加了一点噪音,并尝试使用R中的“stl”和“decompose”函数对其进行分解,而我的系列肯定有超过2个句点并且是对于这两个函数,R给出了以下错误:

x
  [1]  1.4537365796  2.7185844368  2.8394728999  3.8926989923  4.3405508086  5.1959080871
  [7]  5.6602505790  5.4829985648  5.6357660330  4.6084976233  4.6617322922  4.0286486832
 [13]  3.3641752333  1.7408063182  0.8815147612  0.2895139342 -0.5402768515 -1.5612641107
 [19] -2.1584502547 -2.9878043526 -3.5545638149 -4.0530074199 -4.0748538612 -4.7581704662
 [25] -4.6555349052 -4.0726206240 -3.1646413472 -2.6934453823 -2.2364605277 -1.2643569882
 [31] -0.1202011946  1.1136371449  2.2504199271  3.0313528996  3.5384449109  4.5176211013
 [37]  5.4013172839  5.4252837451  5.4768196692  5.8979709077  5.6698285659  4.5133489450
 [43]  4.2702602998  3.5180837069  2.2652913344  1.1975595698  0.5412697849 -0.5966162032
 [49] -1.0827728340 -1.8488242277 -3.4118061838 -3.9009752140 -3.9102671954 -4.3486102172
 [55] -4.7481017993 -4.0097598695 -3.9078554267 -3.8070416888 -2.5968567322 -2.2567568949
 [61] -1.1423907008  0.0002492447  0.4338279080  1.2431986797  2.3216397323  3.3235925116
 [67]  4.1591487169  4.9028481873  5.4535861470  5.0579349546  5.1548777627  4.9707124992
 [73]  5.4496833187  4.4563072487  4.1301372986  2.4594352788  1.7253019929  0.6961453965
 [79]  0.4281167695 -1.3152944759 -1.8645880957 -2.5764132038 -3.7681528112 -4.3731672862
 [85] -3.9940201611 -4.5497596299 -4.9496796983 -4.1233093447 -3.7759837204 -3.3359027749
 [91] -2.3518009102 -1.7488933797 -0.7225148838  0.5395759836  1.0496249652  2.0383715782
 [97]  3.2357449979  3.8028316517  5.0346866280  5.2154265148

fit<- stl(x, t.window=15, s.window="per", robust=TRUE)
Error in stl(x, t.window = 15, s.window = "per", robust = TRUE) :series is not periodic or has less      than two periods

fit<- decompose(x,type="multiplicative")
Error in decompose(x, type = "multiplicative") :time series has no or less than 2 periods

有人会帮我解决这个问题吗?

1 个答案:

答案 0 :(得分:11)

从错误消息中可以看出这一点:

time series has no or less than 2 periods

?我没有告诉你你的数据不是周期性的,只是你传递的数据没有指示它们是周期性的。

从R 的角度来看,您的时间序列x没有周期性。看起来你似乎忘了告诉,或者说错误ts()周期性是什么。由于您没有显示x是如何创建的,除了告诉您返回并创建x以使其确实具有&gt; = 2个句点之外,我们无法做很多事情。

这里的观点是,在它自己的基础上,R不能推断每单位时间的观察频率。你必须告诉ts()这些信息。您可以通过多种方式执行此操作:

  

frequency:每单位时间的观察次数。

     

deltat:连续之间的采样周期的分数            观察;例如,每月数据的1/12。只有一个            应提供frequencydeltat

如果您未提供其中之一,ts()会使用默认设置frequency = 1deltat = 1,这表示每单位时间一次观察的时间序列(每年一次)例如)。

stl()需要"ts"分类对象 - 如果您不提供,则会通过"ts"将输入数据强制转换为as.ts()对象。此函数将使用我在上面描述的默认值。

我认为这里发生的事情是你没有意识到stl()需要一个"ts"类对象,而且当你刚刚提供了向量时它为你的数据创建了一个不合适的对象。观察结果。

解决方案是通过"ts"显式创建ts()分类对象,并指定frequencydeltat之一。

E.g。

dat <- cumsum(rnorm(12*4))
x <- ts(dat)
stl(x, "periodic")
xx <- ts(dat, frequency = 12)
stl(xx, "periodic")

在这里,我使用frequency = 12表示每单位时间有12个观察值 - 例如每月数据。

以上给出了我

R> stl(x, "periodic")
Error in stl(x, "periodic") : 
  series is not periodic or has less than two periods

R> stl(xx, "periodic")
 Call:
 stl(x = xx, s.window = "periodic")

Components
       seasonal    trend remainder
Jan 1 -0.103529  0.55245  -0.44301
Feb 1  0.001333  0.56981   0.86135
Mar 1 -0.382075  0.58717   1.11162
Apr 1  0.010552  0.59891  -1.04966
....

对于您的数据,我怀疑您希望frequency = 10给出时间序列的长度;这就是说你每年有十次观察。如果该系列每年有更多的观察结果,比如每月的数据为12,但是你没有过去两个月或前两个月(即没有丢失的数据,NA)你刚刚开始(结束) (早些时候)在这一年中,因此在系列的一端或两端都没有足够的数据。