挑战:通过排序一堆嵌套的dict创建一个列表

时间:2013-10-31 14:59:30

标签: python list sorting dictionary

我很难弄清楚如何设置sort()函数来处理复杂的数据结构。

以下是数据:

{
    "GROUP-A": {
        "key-A1": {
            "GROUP-B": {
                "key-B1": {
                    "GROUP-C": {
                        "key-C1": 100,
                        "key-C2": 850,
                        "key-C3": 50
                    }
                },
                "key-B2": {
                    "GROUP-C": {
                        "key-C1": 700,
                        "key-C2": 1100,
                        "key-C3": 500
                    }
                },
                "key-B3": {
                    "GROUP-C": {
                        "key-C1": 150,
                        "key-C2": 300,
                        "key-C3": 450
                    }
                }
            }
        },
        "key-A2": {
            "GROUP-B": {
                "key-B1": {
                    "GROUP-C": {
                        "key-C1": 0,
                        "key-C2": 0,
                        "key-C3": 0
                    }
                },
                "key-B2": {
                    "GROUP-C": {
                        "key-C1": 50,
                        "key-C2": 150,
                        "key-C3": 250
                    }
                },
                "key-B3": {
                    "GROUP-C": {
                        "key-C1": 150,
                        "key-C2": 50,
                        "key-C3": 200
                    }
                }
            }
        },
        "key-A3": {
            "GROUP-B": {
                "key-B1": {
                    "GROUP-C": {
                        "key-C1": 100000,
                        "key-C2": 0,
                        "key-C3": 0
                    }
                },
                "key-B2": {
                    "GROUP-C": {
                        "key-C1": 0,
                        "key-C2": 0,
                        "key-C3": 0
                    }
                },
                "key-B3": {
                    "GROUP-C": {
                        "key-C1": 0,
                        "key-C2": 0,
                        "key-C3": 0
                    }
                }
            }
        }
    }
}

还要考虑我有多个key-Ax词典。

我想要返回的是由key-A中的值排序的key-C类型的dict列表,但不更改该键内的数据结构。

例如,根据上面提供的数据,我希望看到:

[{"key-A3":{..}},{"key-A1":{..}},{"key-A2":{..}}]

这是用单sort()函数实现的,还是太复杂了?

可能是这种类型的东西:

filtered = sorted(data["GROUP-A"].items(), key= lambda kv: (??????))

我一直在修补lambda函数一段时间,但我无法按预期工作。

如果可以,请解释所涉及的步骤吗?我很难理解你是如何在较小的部分中解决问题的......以及背后的原因。

谢谢!

编辑:如果你想尝试一下,这里有一个在线python编辑器的链接http://repl.it/MDY/1

1 个答案:

答案 0 :(得分:1)

您可以将多个列表推导链接在一起,以迭代字典的各个层。

filtered = sorted(data["GROUP-A"].items(), key= lambda kv: max(value for group_b in kv[1].itervalues() for key_b in group_b.itervalues() for group_c in key_b.itervalues() for value in group_c.itervalues()))
print filtered

结果:

[
    ('key-A2', {...}), 
    ('key-A1', {...}), 
    ('key-A3', {...})
]

(如果您希望项目从最大到最小排序,请使用关键字参数reverse=True

以牺牲几行为代价,制作更易读的辅助函数可能更好。

def get_biggest_c_value(key_a):
    values = []
    for group_b in key_a.itervalues():
        for key_b in group_b.itervalues():
            for group_c in key_b.itervalues():
                for value in group_c.itervalues():
                    values.append(value)
    return max(values)

filtered = sorted(data["GROUP-A"].items(), key=lambda kv: get_biggest_c_value(kv[1]))
print filtered