如何合并嵌套元组

时间:2011-08-17 20:10:31

标签: python merge tree

我有一组嵌套元组:

('id', ('name', ('name_float_fml',)), ('user', ('email',)), ('user', ('last_login',)))

我想将列表与类似的前缀组合在一起,结果是:

('id', ('name', ('name_float_fml',)), ('user', ('email','last_login')))

这是另一个例子:

(('baz', ('bing', ('fizz', 'frozz', ('frazz', ('fry', 'bleep', 'blop'))))), ('baz', ('zap', ('zang',))), 'foo', 'bar')

将合并到:

(('baz', (('bing', ('fizz', 'frozz', ('frazz', ('fry', 'bleep', 'blop')))), ('zap', ('zang')))), 'foo', 'bar')

这些用于存储从根到树叶的路径:

  • '巴兹' - > '冰' - > ' fizz',又名。 ('baz' ('bing' ('fizz,)))
  • '巴兹' - > ' ZAP' - > ' zang',又名('baz' ('zap', ('zang',)))
  • '巴兹' - > '冰' - > ' frazz' - > ' blop',又名('baz', ('bing', ('frazz', ('blop,))))

我想合并通过相同路径到达叶子的元素。我希望这可以提供一些澄清。

我已经写了一些代码来做这件事,但它很丑陋,冗长,而且可能很脆弱。是否有一些通用,简洁和/或有效的方法来做到这一点?我想可能会有某种itertools魔法,我不知道哪种魔法可以提供一些优雅的解决方案。

注意:我正在使用python 2.4

3 个答案:

答案 0 :(得分:4)

这是适用于您发布的示例的版本:

a = ('id', ('name', ('name_float_fml',)), ('user', ('email',)), ('user', ('last_login',)))
b = (('baz', ('bing', ('fizz', 'frozz',('frazz', ('fry', 'bleep', 'blop'))))), ('baz', ('zap', ('zang',))), 'foo', 'bar')

def preserve_path(value):
    if len(value) == 2 and isinstance(value[1], (list, tuple)):
        return [value]
    else:
        return value

def flatten_group(my_list):
    d = {}
    for item in my_list:
        # Only items with one string, followed by one tuple represent a path
        # segment. In all other situations, strings are leaves.
        if isinstance(item, (list, tuple)) and len(item) == 2:
            key, value = item
            if key in d:
                d[key].extend(flatten_group(preserve_path(value)))
            else:
                d[key] = preserve_path(list(flatten_group(value)))
        else:
            yield item

    for item in d.iteritems():
        yield item

print list(flatten_group(a))
# ['id', ('name', ['name_float_fml']), ('user', ['email', 'last_login'])]
print list(flatten_group(b))
# ['foo', 'bar', ('baz', [['bing', ('fizz', 'frozz', ('frazz', ('fry', 'bleep', 'blop')))], ('zap', ['zang'])])]

编辑3:使用适用于这两个示例的合着版本进行了更新,并且包含了您只需要考虑合并元组/列表并包含两个项目的限制。这也可以防止合并项目的额外扁平化。

答案 1 :(得分:0)

以下是执行此操作的递归函数:

def merge(x, bases = (tuple, list)):
    for e in x:
        if type(e) in bases:
            for e in merge(e, bases):
                yield e
        else:
            yield e

tup = (0, (1, 3, 2), [5, (7, 2)])

print list(merge(tup))
# [0, 1, 3, 2, 5, 7, 2]

答案 2 :(得分:0)

以下是使用itertools.groupby的解决方案:

from itertools import groupby
def combine(tuples):
    rlist = [tuples[0]]
    for k, g in groupby(tuples[1:], key=lambda t: t[0]):
        rlist.append(tuple((k, tuple(gg[1:][0][0] for gg in g))))
    return tuple(rlist)

sample = ('id', ('name', ('name_float_fml',)), ('user', ('email',)), ('user', ('last_login',)))
print combine(sample)
# ('id', ('name', ('name_float_fml',)), ('user', ('email', 'last_login')))

对于比您问题中给出的样本更复杂的样本,可能会递归应用此过程。