很抱歉,是否曾经有人问过这个问题,但是当存在三个分组变量时,我找不到所需的答案。
我需要用变量的可能组合来填充数据框,但是当不出现组合时,为不分组的观察值插入NA。假设有一个包含三个分组变量的数据框:年,地理和分组:
Year <- rep(2008:2019,each=50)
Geography <- rep(1:60,each=10)
Grouping <- rep(1:4,each=150)
value <- seq(rnorm(600,mean=0,sd=1))
df=cbind(Year,Geography)
df=as.data.frame(cbind(df,value))
但是数据框缺少一些随机观测,例如:
df2=df[-c(15,60,150,510),]
如何将数据帧改回长度为600(如果存在三个分组变量的所有可能组合,则为该长度),但是将NA插入其中,如果组合位于数据框?请注意,每个分组变量的所有唯一观测值都在某个时刻出现在数据集中。