避免在嵌套字典中存储值的关键错误(Python)

时间:2016-04-29 16:19:27

标签: python dictionary graph nested setdefault

简介

以下字典有三个级别的键,然后是一个值。

d = {
    1:{
        'A':{
            'i': 100,
            'ii': 200
            }, 
        'B':{
            'i': 300
            }
        }, 
    2:{
        'A':{
            'ii': 500
            }
        }
    }

需要添加的示例。

d[1]['B']['ii'] = 600      # OK
d[2]['C']['iii'] = 700     # Keyerror on 'C'
d[3]['D']['iv'] = 800      # Keyerror on 3

问题陈述

我想创建能够创建必要嵌套键并避免任何键错误的代码。

解决方案1 ​​

我提出的第一个解决方案是:

def NewEntry_1(d, lv1, lv2, lv3, value):
    if lv1 in d:
        if lv2 in d:
            d[lv1][lv2][lv3] = value
        else:
            d[lv1][lv2] = {lv3: value}
    else:
        d[lv1] = {lv2: {lv3: value}}

似乎是合法的,但是将它嵌入到代码片段中使它令人难以置信。我为其他解决方案探索了Stackoverflow,并阅读了get()和setdefault()函数。

解决方案2

有很多关于get()和setdefault()的材料,但在嵌套字典上并没有那么多。最终我能够提出:

def NewEntry_2(d, lv1, lv2, lv3, value):
    return d.setdefault(lv1, {}).setdefault(lv2,{}).setdefault(lv3, value)

这是一行代码,因此没有必要使它成为一个函数。可轻松修改以包含操作:

d[lv1][lv2][lv3] = d.setdefault(lv1, {}).setdefault(lv2,{}).setdefault(lv3, 0) + value

似乎很完美?

问题

当添加大量条目并进行许多修改时,选项2是否优于选项1?或者我应该定义函数1并调用它?我正在寻找的答案应该考虑速度和/或错误的可能性。

实施例

NewEntry_1(d, 1, 'B', 'ii', 600)
# output = {1: {'A': {'i': 100, 'ii': 200}, 'B': {'i': 300, 'ii': 600}}, 2: {'A': {'ii': 500}}}

NewEntry_1(d, 2, 'C', 'iii', 700)
# output = {1: {'A': {'i': 100, 'ii': 200}, 'B': {'i': 300, 'ii': 600}}, 2: {'A': {'ii': 500}, 'C': {'iii': 700}}}

NewEntry_1(d, 3, 'D', 'iv', 800)
# output = {1: {'A': {'i': 100, 'ii': 200}, 'B': {'i': 300, 'ii': 600}}, 2: {'A': {'ii': 500}, 'C': {'iii': 700}}, 3: {'D': {'iv': 800}}}

更多背景

我是一位业务分析师,正在探索使用Python创建Graph DB,这将帮助我进行非常具体的分析。字典结构用于描述一个节点对其中一个邻居的影响:

  • lv1是Node From
  • lv2是Node To
  • lv3是Iteration
  • 价值是影响力(in %)

在第一次迭代中,节点1对节点2有直接影响。在第二次迭代中,节点1影响节点2正在影响的所有节点。

我知道可以帮助我的软件包(networkx),但我想在开始使用它之前尝试理解Python / GraphDB。

1 个答案:

答案 0 :(得分:3)

至于嵌套词典,你应该看一下defaultdict。使用它将为您节省大量的函数调用开销。嵌套的defaultdict构造为其默认工厂转换为lambda函数:

d = defaultdict(lambda: defaultdict(lambda: defaultdict(int)))  # new, shiny, empty
d[1]['B']['ii'] = 600      # OK
d[2]['C']['iii'] = 700     # OK
d[3]['D']['iv'] = 800      # OK

更新:创建深层嵌套defaultdict的有用技巧如下:

def tree():
    return defaultdict(tree)

d = tree()  
# now any depth is possible
# d[1][2][3][4][5][6][7][8] = 9