在R中为列表列创建新列

时间:2015-11-25 06:05:38

标签: json r

我有一个json代码,我尝试将其转换为data.frame,但第一列最终是其他数据框的列表。

library(jsonlite)

json_emp<-' [ {"employee": [
{
  "name": "person1",
  "ID": 1
},
  {
  "name": "person2",
  "ID": 2
  },
  {
  "name": "person3",
  "ID": 3
  }
  ],
  "date": "11-24-2015"
  },
  {
  "employee": [
  {
  "name": "person1",
  "ID": 1
  },
  {
  "name": "person2",
  "ID": 2
  }
  ],
  "date": "11-25-2015"
  },
  {
  "employee": [
  {
  "name": "person1",
  "ID": 1
  }
  ],
  "date": "11-26-2015"
  }
  ]'


df<- fromJSON(json_emp)

do.call("rbind",df$employee)

我做了do.call函数,结果是这样的:

        date    name ID
1 11-24-2015 person1  1
2 11-24-2015 person2  2
3 11-24-2015 person3  3
4 11-25-2015 person1  1
5 11-25-2015 person2  2
6 11-26-2015 person1  1

结果看起来不错,但我还需要插入/连接包含df数据帧上日期的列。有没有办法合并两个数据框或只是一个我们也可以包含数据的代码?

2 个答案:

答案 0 :(得分:5)

您可以尝试使用&#34; tidyr&#34;中的unnest包:

library(tidyr)
unnest(fromJSON(json_emp), employee)
# Source: local data frame [6 x 3]
# 
#         date    name    ID
#        (chr)   (chr) (int)
# 1 11-24-2015 person1     1
# 2 11-24-2015 person2     2
# 3 11-24-2015 person3     3
# 4 11-25-2015 person1     1
# 5 11-25-2015 person2     2
# 6 11-26-2015 person1     1

在基地R,您可以尝试(从您的&#34; df&#34;步骤开始):

cbind(do.call(rbind, df$employee), 
      date = rep(df$date, sapply(df$employee, nrow)))

答案 1 :(得分:4)

我们可以使用rbindlist

中的library(data.table)
library(data.table)#v1.9.6+
rbindlist(with(df, setNames(employee,date)), idcol=TRUE)
#          .id    name ID
#1: 11-24-2015 person1  1
#2: 11-24-2015 person2  2
#3: 11-24-2015 person3  3
#4: 11-25-2015 person1  1
#5: 11-25-2015 person2  2
#6: 11-26-2015 person1  1