绑定包含嵌套data.frames列的r data.frames

时间:2019-12-13 02:20:57

标签: r tidyr rbind jsonlite

使用jsonlite导入多个.json文件后,我正在寻找绑定结果data.frame的方法,这些数据包含一列或多列本身就是嵌套的data.frames。 我碰到了以下帖子https://r.789695.n4.nabble.com/data-frame-with-nested-data-frame-td3162660.html,该帖子有助于重点说明问题。

## Create nested data.frames
dat1 <- data.frame(x = 1)
dat1$y <- data.frame(y1 = "a", y2 = "A", stringsAsFactors = FALSE)

dat2 <- data.frame(x = 2)
dat2$y <- data.frame(y1 = "b", stringsAsFactors = FALSE)

这些工作都没有

rbind(dat1, dat2)
dplyr::bind_rows(dat1, dat2)
data.table::rbindlist(list(dat1, dat2))

我发现了一些解决方法,以防它们对他人有所帮助。

2 个答案:

答案 0 :(得分:0)

首先平整数据(对于基础rbind数据。框架必须具有相同的列名)

dplyr::bind_rows(
  jsonlite::flatten(dat1),
  jsonlite::flatten(dat2)
)

在绑定之前将data.frames放入列表中(所有方法现在都可以使用)

dat1$y <- list(dat1$y)
dat2$y <- list(dat2$y)

rbind(dat1, dat2)
dplyr::bind_rows(dat1, dat2)
data.table::rbindlist(list(dat1, dat2))

使用tidyverse嵌套data.frames

tib1 <- tidyr::nest(dat1, y = c(y))
tib2 <- tidyr::nest(dat2, y = c(y))
tib3 <- dplyr::bind_rows(tib1, tib2)
tidyr::unnest(tib3, c(y))

答案 1 :(得分:0)

这也可以不用其他软件包来完成。数据帧需要在unlist中部分list,然后使用merge Reduce d。

Reduce(function(...) merge(..., all=TRUE), Map(unlist, list(dat1, dat2), recursive=FALSE))
#   x y.y1 y.y2
# 1 1    a    A
# 2 2    b <NA>

这也适用于两个以上的嵌套数据帧。

dat3 <- data.frame(x=2, y=data.frame(y1="c", y2="C", z="CC", stringsAsFactors=FALSE))

Reduce(function(...) merge(..., all=TRUE), Map(unlist, list(dat1, dat2, dat3), recursive=FALSE))
#   x y.y1 y.y2  y.z
# 1 1    a    A <NA>
# 2 2    b <NA> <NA>
# 3 2    c    C   CC

数据

dat1 <- structure(list(x = 1, y = structure(list(y1 = "a", y2 = "A"), class = "data.frame", 
                                    row.names = c(NA, -1L))), row.names = c(NA, -1L), 
          class = "data.frame")

dat2 <- structure(list(x = 2, y = structure(list(y1 = "b"), class = "data.frame", 
                                    row.names = c(NA, -1L))), row.names = c(NA, -1L), 
          class = "data.frame")