使用多种数据插补方法来计算缺失数据周期的长度

时间:2014-02-11 06:41:30

标签: r

我有一个时间序列数据的数据集,其中包含许多缺失值。数据是一年中每小时记录的臭氧浓度,缺失数据的时间长度变化很大。由于数据集中的周期不同(例如,每日和季节性),我想根据缺少数据的周期长度使用不同的数据插补方法。我打算使用zoo包进行数据插补。

数据丢失期间数据估算的细分:

  1. < = 4个缺少数据的单元格 - 使用线性插值(na.approx(x))
  2. > 4到< = 23个细胞 - 使用样条拟合(na.spline(x))
  3. > 23个单元格 - 使用季节性卡尔曼滤波器(na.StructTS(x))
  4. 我的猜测是我需要使用条件执行来指示哪些单元格受命令影响,但是我不知道如何引用前后的值单元格并在if语句中使用它们。

    我是R的新手,很抱歉,如果这个问题有明显的答案,或者这个问题已经得到了回答。我做了搜索,但似乎找不到任何东西。

        Date2006    Ozone2006
    1   06-01-01 0:00   64
    2   06-01-01 1:00   64
    3   06-01-01 2:00   63
    4   06-01-01 3:00   61
    5   06-01-01 4:00   NA
    6   06-01-01 5:00   52
    7   06-01-01 6:00   60
    8   06-01-01 7:00   59
    9   06-01-01 8:00   47 
    

    这就是我的数据集的样子。臭氧浓度是整数。

0 个答案:

没有答案