如何为面板数据集创建双向表?

时间:2018-03-09 14:50:29

标签: r panel

我在 R

中设置了以下数据
Country     Year       Population
   A        2000         1,000
   A        2001         1,100
   A        2002         1,200
   B        2000         1,150
   B        2001       
   B        2003         1,400
   C        2000       
   C        2001         1,000
   C        2003         1,100

空格代表缺失值的位置。我正在尝试使用人口列的多年可用数据创建一个双向表。像这样:

Country  2000  2001  2002
   A       1     1     1
   B       1     0     1
   C       0     1     1

1 个答案:

答案 0 :(得分:1)

您可以使用dcast将数据转换为宽屏格式。此外,您可以使用dplyr中的spread

方法1:

library(data.table)
dcast(df[!is.na(df$Population),], formula = Country ~ Year, fun.aggregate = length)

print(df)
  Country 2000 2001 2002 2003
1       A    1    1    1    0
2       B    1    0    0    1
3       C    0    1    0    1

方法2:

df %>% 
    mutate(row_id = if_else(is.na(Population),0,1)) %>% 
    select(-Population) %>% 
    spread(Year, row_id,fill=0)

  Country 2000 2001 2002 2003
1       A    1    1    1    0
2       B    1    0    0    1
3       C    0    1    0    1