用另一个数据框列表列表中的列替换数据框列表列表中的列。 [R

时间:2018-10-19 00:12:26

标签: r list dataframe tidyverse purrr

我有两组具有以下格式的列表:

   list(list(structure(list(X = c(3L, 4L, 5L, 7L, 2L, 8L, 9L, 6L, 
    10L, 1L), Y = structure(c(2L, 2L, 1L, 2L, 1L, 2L, 1L, 1L, 2L, 
    1L), .Label = c("no", "yes"), class = "factor")), .Names = c("X", 
    "Y"), row.names = c(NA, -10L), class = "data.frame"), structure(list(
        X = c(3L, 4L, 5L, 7L, 2L, 8L, 9L, 6L, 10L, 1L), Y = structure(c(2L, 
        2L, 1L, 2L, 1L, 2L, 1L, 1L, 2L, 1L), .Label = c("no", "yes"
        ), class = "factor")), .Names = c("X", "Y"), row.names = c(NA, 
    -10L), class = "data.frame")))

    list(list(structure(list(X = c(10L, 3L, 4L, 9L, 8L, 2L, 5L, 7L, 
1L, 6L), Y = structure(c(2L, 1L, 2L, 2L, 2L, 1L, 1L, 2L, 1L, 
1L), .Label = c("no", "yes"), class = "factor")), .Names = c("X", 
"Y"), row.names = c(NA, -10L), class = "data.frame"), structure(list(
    X = c(5L, 7L, 4L, 3L, 10L, 2L, 9L, 1L, 8L, 6L), Y = structure(c(2L, 
    2L, 1L, 1L, 1L, 1L, 2L, 2L, 1L, 1L), .Label = c("no", "yes"
    ), class = "factor")), .Names = c("X", "Y"), row.names = c(NA, 
-10L), class = "data.frame")))

My objective is to replace a[[1]][[i]]$x <- b[[1]][[i]]$x

当两个数据框不在列表中时,这相当简单:

df1$x<-df2$x

但是我编写的代码不起作用

replacex<-function(onelist, anotherlist){

newlist<-list() #for storage
onelist$x<-anotherlist$x
newlist<-onelist 
}


Dfs_new_X<-lapply(a,lapply,replacex,anotherlist=b)

它不会产生错误,但是会删除该列。

任何帮助将不胜感激。

2 个答案:

答案 0 :(得分:2)

我们可以使用map2包中的purrr进行替换。 dat是最终输出。

library(purrr)

dat <- map2(a, b, function(x, y){
  map2(x, y, function(i, j){
    i[["X"]] <- j[["X"]]
    return(i)
  })
})

dat
# [[1]]
# [[1]][[1]]
#     X   Y
# 1  10 yes
# 2   3 yes
# 3   4  no
# 4   9 yes
# 5   8  no
# 6   2 yes
# 7   5  no
# 8   7  no
# 9   1 yes
# 10  6  no
# 
# [[1]][[2]]
#     X   Y
# 1   5 yes
# 2   7 yes
# 3   4  no
# 4   3 yes
# 5  10  no
# 6   2 yes
# 7   9  no
# 8   1  no
# 9   8 yes
# 10  6  no

我们也可以按照相同的逻辑使用mapply。它产生的结果与map2解决方案相同。

dat2 <- mapply(function(x, y){
  mapply(function(i, j){
    i[["X"]] <- j[["X"]]
    return(i)
  }, x, y, SIMPLIFY = FALSE)
}, a, b, SIMPLIFY = FALSE)

identical(dat, dat2)
# [1] TRUE

答案 1 :(得分:0)

首先让我感到困惑的是,您的示例列表包含一个不必要的层。直接读取您的列表并将它们称为 list_1 和 list_2 会给您:

  • list_1(包含)> 长度为一的列表(包含)> 两个数据帧
  • list_2(包含)> 长度为一的列表(包含)> 两个数据帧

但是,更常见的用例可能如下:

  • list_1(包含)> 两个数据框
  • list_2(包含)> 两个数据框

由于没有迹象表明我描述为“长度为一的列表”的层对于您的示例是必要的,因此我使用

删除了它
list_1 <- list_1[[1]]
list_2 <- list_2[[1]]

然后,您可以省去 map2 的双重应用,只需使用 dplyr 包中的 mutate

purrr::map2(list_1, list_2, function(l1, l2){
  dplyr::mutate(l1, X = l2$X)
})