R data.table差分方程(动态面板数据)

时间:2017-08-10 09:38:41

标签: r data.table panel-data

我有一个数据表,其列v2带有'初始值'以及具有增长率的列v1。我想通过将前一个值增加到因子v1来推断v2超过可用值多年。在'时间序列'符号v2(t + 1)= v2(t)* v1(t),给定v2(0)。

问题是,初始值的年份可能会因数据集中的组x而异。在某些组中,v2可能在多年内可用,或者根本不可用。此外,每组的年数可能会有所不同(不平衡的小组)。使用shift函数没有帮助,因为它将v2移位一次,并且不引用先前的更新值。

        x year        v1       v2
     1: a 2012 0.8501072       NA
     2: a 2013 1.0926093 39.36505
     3: a 2014 1.2084379       NA
     4: a 2015 0.8921997       NA
     5: a 2016 0.8023251       NA
     6: b 2012 1.1005287       NA
     7: b 2013 1.0139800       NA
     8: b 2014 1.1539676       NA
     9: b 2015 1.2282501       NA
    10: b 2016 0.8052265       NA
    11: c 2012 0.8866425       NA
    12: c 2013 0.9952566 44.30377
    13: c 2014 0.9092020       NA
    14: c 2015 1.0295864 15.04948
    15: c 2016 0.8812966       NA

V2,x = a,year = 2014的值应为39.36 * 1.208,而2015年的回答时间为0.89。

以下代码在一组循环中起作用并按我的要求行事:

    ivec<-unique(DT[,x])
    for (i in 1:length(ivec)) {
       tvec<-unique(DT[x==ivec[i] ,y])
         for (t in 2:length(tvec)) {
           if (is.na(DT[x==ivec[i] & y==tvec[t], v2])) {
              DT[x==ivec[i] & y==tvec[t],v2:=DT[x==ivec[i] & y==tvec[(t-1)],v2]*v1]
           }
         }
      }

1 个答案:

答案 0 :(得分:0)

试试这个:

DT[, v2:= Reduce(`*`, v1[-1], init=v2[1], acc=TRUE), by=.(x, cumsum(!is.na(v2)))]

#     x year        v1       v2
#  1: a 2012 0.8501072       NA
#  2: a 2013 1.0926093 39.36505
#  3: a 2014 1.2084379 47.57022
#  4: a 2015 0.8921997 42.44213
#  5: a 2016 0.8023251 34.05239
#  6: b 2012 1.1005287       NA
#  7: b 2013 1.0139800       NA
#  8: b 2014 1.1539676       NA
#  9: b 2015 1.2282501       NA
# 10: b 2016 0.8052265       NA
# 11: c 2012 0.8866425       NA
# 12: c 2013 0.9952566 44.30377
# 13: c 2014 0.9092020 40.28108
# 14: c 2015 1.0295864 15.04948
# 15: c 2016 0.8812966 13.26306