使用元组键展平嵌套字典

时间:2019-07-03 20:42:33

标签: python dictionary

如何将此question推广到可能是元组的大小写键?

即使在所有字符串键的情况下,这样做也是有益的,如果将它们累积到一个元组,则不需要临时分隔符(尽管JSON导出是另一回事):

一种方法是基于此answer。我尝试了2个版本:

def flatten_keys(d,handler,prefix=[]):
    return {handler(prefix,k) if prefix else k : v
        for kk, vv in d.items()
        for k, v in flatten_keys(vv, handler, kk).items()
        } if isinstance(d, dict) else { prefix : d }

元组处理程序在哪里:

def tuple_handler_1(prefix,k):
    return tuple([prefix]+[k])

def tuple_handler_2(prefix,k):
    return tuple(flatten_container((prefix,k)))

使用实用程序生成器:

def flatten_container(container):
    for i in container:
        if isinstance(i, (list,tuple)):
            for j in flatten_container(i):
                yield j
        else:
            yield i

考虑测试字典之一,但使用元组键('hgf',1)

data =  {'abc':123, ('hgf',1):{'gh':432, 'yu':433}, 'gfd':902, 'xzxzxz':{"432":{'0b0b0b':231}, "43234":1321}}

两者均无法正常工作:

flatten_keys(data,tuple_handler_1)
  

{'abc':123,((''hgf',1),'gh'):432,((''hgf',1),'yu'):433,   'gfd':902,('xzxzxz',('432','0b0b0b')):231,('xzxzxz','43234'):   1321}

('xzxzxz', ('432', '0b0b0b'))。没有展平

第二个将输入的元组键变平

flatten_keys(data,tuple_handler_2)
  

{'abc':123,('hgf',1,'gh'):432,('hgf',1,'yu'):433,'gfd':   902,('xzxzxz','432','0b0b0b'):231,('xzxzxz','43234'):1321}

扁平化方法是否有明显的修改,可以正确连接字符串和其他哈希值?

编辑

根据下面的评论,使用此方法处理键冲突是字符串键(例如{'a_b':{'c':1}, 'a':{'b_c':2}})的基本情况。

因此,即使对于len 1个密钥路径,每个密钥路径也应该是一个元组,以避免密钥冲突,例如{((1,2),): 3, (1,2):4}}

1 个答案:

答案 0 :(得分:1)

假设您需要以下输入/输出

# input
{'abc': 123,
 ('hgf', 1): {'gh': 432, 'yu': 433},
 'gfd': 902,
 'xzxzxz': {'432': {'0b0b0b': 231}, '43234': 1321}}

# output
{('abc',): 123,
 (('hgf', 1), 'gh'): 432,
 (('hgf', 1), 'yu'): 433,
 ('gfd',): 902,
 ('xzxzxz', '432', '0b0b0b'): 231,
 ('xzxzxz', '43234'): 1321}

一种方法是对字典进行递归,直到找到一个非字典值,然后在递归过程中将当前键作为元组向下传递。

def flatten_dict(deep_dict): 
    def do_flatten(deep_dict, current_key): 
        for key, value in deep_dict.items():
            # the key will be a flattened tuple
            # but the type of `key` is not touched
            new_key = current_key + (key,)
            # if we have a dict, we recurse
            if isinstance(value, dict): 
                yield from do_flatten(value, new_key) 
            else:
                yield (new_key, value) 
    return dict(do_flatten(deep_dict, ()))