展平字典时处理自引用

时间:2018-04-20 16:52:11

标签: python dictionary recursion

给出一些任意字典

mydict = {
    'first': {
        'second': {
            'third': {
                'fourth': 'the end'
             }
         }
     }
}

我已经写了一个小程序,在writing an answer的过程中将其压扁到另一个问题。

def recursive_flatten(mydict):
    d = {}
    for k, v in mydict.items():
        if isinstance(v, dict):
            for k2, v2 in recursive_flatten(v).items():
                d[k + '.' + k2] = v2 
        else:
            d[k] = v
    return d

它有效,给我我想要的东西:

new_dict = recursive_flatten(mydict)

print(new_dict)
{'first.second.third.fourth': 'the end'}

并且应该适用于任何任意结构化的字典。不幸的是,它没有:

mydict['new_key'] = mydict

现在recursive_flatten(mydict)将一直运行,直到我的堆栈空间不足。我试图弄清楚如何优雅地处理自引用(基本上,忽略或删除它们)。更复杂的是,任何子词典都可能出现自我引用...而不仅仅是顶层。我如何优雅地处理自我引用?我可以想到一个可变的默认参数,但应该是一个更好的方法......对吗?

指针赞赏,感谢阅读。如果您有recursive_flatten,我欢迎任何其他建议/改进。

2 个答案:

答案 0 :(得分:2)

使用setid的一种方法。注意这个解决方案也使用生成器,这意味着我们可以在计算整个结果之前开始使用我们的扁平dict

def recursive_flatten (mydict):
  def loop (seen, path, value):

    # if we've seen this value, skip it
    if id(value) in seen:
      return

    # if we haven't seen this value, now we have
    else:
      seen.add(id(value))

    # if this value is a dict...
    if isinstance (value, dict):
      for (k, v) in value.items ():
        yield from loop(seen, path + [k], v)

    # base case
    else:
      yield (".".join(path), value)

  # init the loop    
  yield from loop (set(), [], mydict)

程序演示

mydict = {
    'first': {
        'second': {
            'third': {
                'fourth': 'the end'
             }
         }
     }
}

for (k,v) in recursive_flatten (mydict):
  print (k, v)

# first.second.third.fourth the end

mydict['new_key'] = mydict

for (k,v) in recursive_flatten (mydict):
  print (k, v)

# first.second.third.fourth the end

如果您希望查看自引用值的输出

,我们可以稍作修改
# if we've seen this value, skip it
if (id(value) in seen):
  # this is the new line
  yield (".".join(path), "*self-reference* %d" % id(value))
  return

现在程序的输出将是

first.second.third.fourth the end
first.second.third.fourth the end
new_key *self-reference* 139700111853032

答案 1 :(得分:1)

我不确定你的定义是什么"优雅"是的,但这可以通过对set对象ID中之前看到的内容进行一些记录来完成:

class RecursiveFlatten:
    def __init__(self):
        self.seen = set()

    def __call__(self, mydict):
        self.seen.add(id(mydict))
        d = {}
        for k, v in mydict.items():
            if isinstance(v, dict):
                if id(v) not in self.seen:
                    self.seen.add(id(v))
                    for k2, v2 in self(v).items():
                        d[k + '.' + k2] = v2
            else:
                d[k] = v
        return d

def recursive_flatten(mydict):
    return RecursiveFlatten()(mydict)

测试它给了我期待的东西

mydict = {
    'first': {
        'second': {
            'third': {
                'fourth': 'the end'
             }
         },
        'second2': {
            'third2': 'the end2'
        }
     }
}

mydict['first']['second']['new_key'] = mydict
mydict['new_key'] = mydict
print(recursive_flatten(mydict))

输出:

{'first.second2.third2': 'the end2', 'first.second.third.fourth': 'the end'}