R - 使用覆盖和递归合并列表

时间:2012-12-11 00:06:11

标签: r list recursion

假设我有两个名字列表,

a = list( a=1, b=2, c=list( d=1, e=2 ), d=list( a=1, b=2 ) )
b = list( a=2, c=list( e=1, f=2 ), d=3, e=2 )

我想以递归方式合并这些列表,如果第二个参数包含冲突值,则覆盖条目。即预期的产出将是

$a
[1] 2

$b
[1] 2

$c
$c$d
[1] 1

$c$e
[1] 1

$c$f
[1] 2

$d
[1] 3

$e
[1] 2

任何提示?

2 个答案:

答案 0 :(得分:9)

我认为你必须在这里编写自己的递归函数。

一个包含两个列表list1list2的函数。 如果:

  • list1[[name]]但不是list2[[name]],请使用list1[[name]];
  • list1[[name]]以及list2[[name]]都存在且两者都不是列表,请使用list2[[name]];
  • 否则,以list1[[name]]list2[[name]]作为新列表进行递归。

类似的东西:

myMerge <- function (list1, list2) {
    allNames <- unique(c(names(list1), names(list2)))
    merged <- list1 # we will copy over/replace values from list2 as necessary
    for (x in allNames) {
        # convenience
        a <- list1[[x]]
        b <- list2[[x]]
        if (is.null(a)) {
            # only exists in list2, copy over
            merged[[x]] <- b
        } else if (is.list(a) && is.list(b)) {
            # recurse
            merged[[x]] <- myMerge(a, b)
        } else if (!is.null(b)) {
            # replace the list1 value with the list2 value (if it exists)
            merged[[x]] <- b
        }
    }
    return(merged)
}

警告 - 如果你要合并的列表很奇怪,你可能会得到奇怪的输出。例如:

a <- list( a=list(a=1, b=2), b=3 )
b <- list( a=2 )

然后您的合并列表包含a=2, b=3。这是因为b$a的值会覆盖a$a的值,即使a$a是一个列表(您没有指定如果是这种情况会发生什么)。但是,修改myMerge以处理这些类型的案例非常简单。请记住 - 使用is.list来测试它是否是列表,并is.null(myList$a)查看列表a中是否存在条目myList


以下是使用sapply的“矢量化”版本:

merge.lists <- function(a, b) {
    a.names <- names(a)
    b.names <- names(b)
    m.names <- sort(unique(c(a.names, b.names)))
    sapply(m.names, function(i) {
        if (is.list(a[[i]]) & is.list(b[[i]])) merge.lists(a[[i]], b[[i]])
        else if (i %in% b.names) b[[i]]
        else a[[i]]
    }, simplify = FALSE)
}

答案 1 :(得分:8)

我不确定这里是否需要自定义功能。有一个函数utils::modifyList()来执行完全相同的操作!有关详细信息,请参阅modifyList

a <- list( a=1, b=2, c=list( d=1, e=2 ), d=list( a=1, b=2 ) )
b <- list( a=2, c=list( e=1, f=2 ), d=3, e=2 )

modifyList(a, b) # updates(modifies) 'a' with 'b'

以下是

$a
[1] 2

$b
[1] 2

$c
$c$d
[1] 1

$c$e
[1] 1

$c$f
[1] 2

$d
[1] 3

$e
[1] 2