根据分组变量的可能组合创建完整的数据框架

时间:2020-11-12 21:00:55

标签: r missing-data

很抱歉,是否曾经有人问过这个问题,但是当存在三个分组变量时,我找不到所需的答案。

我需要用变量的可能组合来填充数据框,但是当不出现组合时,为不分组的观察值插入NA。假设有一个包含三个分组变量的数据框:年,地理和分组:

Year <- rep(2008:2019,each=50)
Geography <- rep(1:60,each=10)
Grouping <- rep(1:4,each=150)
value <- seq(rnorm(600,mean=0,sd=1))
df=cbind(Year,Geography)
df=as.data.frame(cbind(df,value))

但是数据框缺少一些随机观测,例如:

df2=df[-c(15,60,150,510),]

如何将数据帧改回长度为600(如果存在三个分组变量的所有可能组合,则为该长度),但是将NA插入其中,如果组合位于数据框?请注意,每个分组变量的所有唯一观测值都在某个时刻出现在数据集中。

0 个答案:

没有答案