我试图学习来自Stata的R,但遇到了以下两个问题,我似乎无法在R中找到优雅的解决方案:
1)我有一个面板数据集,我的时间变量有差距。我想扩展我的时间变量以包括间隙,尽管没有观察到这些行的数据。
在Stata中,我通常会使用xtset
设置ID和时间变量,然后使用tsfill
扩展基于此的数据集。 R中是否有一种等效的优雅方式?
2)我想用一些常量变量的数据填充一些新的空白单元格。
在Stata中我会通过使用l.
- 前缀复制先前(相对于我的时间变量)观察数据来完成此操作;例如,使用replace Con = l.Con
。
换句话说,我在问这样的事情:
ID Time Num Con
1 Jan 10 A
1 Feb 15 A
1 May 20 A
2 Feb 12 B
2 Mar 14 B
2 Jun 15 B
对于这样的事情:
ID Time Num Con
1 Jan 10 A
1 Feb 15 A
1 Mar A
1 Apr A
1 May 20 A
2 Feb 12 B
2 Mar 14 B
2 Apr B
2 May B
2 Jun 15 B
希望这是有道理的。提前谢谢。
答案 0 :(得分:3)
您可以尝试merge
或base R
加入
data.table
library(data.table)
DT2 <- setDT(df1)[, {tmp <- match(Time, month.abb)
list(Time=month.abb[min(tmp):max(tmp)])}, .(ID,Con)]
setkey(df1[, c(1,4,2,3), with=FALSE], ID, Con, Time)[DT2]
# ID Con Time Num
# 1: 1 A Jan 10
# 2: 1 A Feb 15
# 3: 1 A Mar NA
# 4: 1 A Apr NA
# 5: 1 A May 20
# 6: 2 B Feb 12
# 7: 2 B Mar 14
# 8: 2 B Apr NA
# 9: 2 B May NA
#10: 2 B Jun 15
注意:最好将缺失值保留为NA