R:在面板数据中插入并填充缺失的句点

时间:2015-07-03 20:48:29

标签: r time-series panel-data

我试图学习来自Stata的R,但遇到了以下两个问题,我似乎无法在R中找到优雅的解决方案:

1)我有一个面板数据集,我的时间变量有差距。我想扩展我的时间变量以包括间隙,尽管没有观察到这些行的数据。

在Stata中,我通常会使用xtset设置ID和时间变量,然后使用tsfill扩展基于此的数据集。 R中是否有一种等效的优雅方式?

2)我想用一些常量变量的数据填充一些新的空白单元格。

在Stata中我会通过使用l. - 前缀复制先前(相对于我的时间变量)观察数据来完成此操作;例如,使用replace Con = l.Con

换句话说,我在问这样的事情:

ID     Time     Num     Con
1      Jan      10      A
1      Feb      15      A
1      May      20      A
2      Feb      12      B
2      Mar      14      B
2      Jun      15      B

对于这样的事情:

ID     Time     Num     Con
1      Jan      10      A
1      Feb      15      A
1      Mar              A
1      Apr              A
1      May      20      A
2      Feb      12      B
2      Mar      14      B
2      Apr              B
2      May              B
2      Jun      15      B

希望这是有道理的。提前谢谢。

1 个答案:

答案 0 :(得分:3)

您可以尝试mergebase R加入

中的data.table
 library(data.table)
 DT2 <- setDT(df1)[, {tmp <- match(Time, month.abb)
      list(Time=month.abb[min(tmp):max(tmp)])}, .(ID,Con)]
 setkey(df1[, c(1,4,2,3), with=FALSE], ID, Con, Time)[DT2]
 #    ID Con Time Num
 # 1:  1   A  Jan  10
 # 2:  1   A  Feb  15
 # 3:  1   A  Mar  NA
 # 4:  1   A  Apr  NA
 # 5:  1   A  May  20
 # 6:  2   B  Feb  12
 # 7:  2   B  Mar  14
 # 8:  2   B  Apr  NA
 # 9:  2   B  May  NA
 #10:  2   B  Jun  15

注意:最好将缺失值保留为NA