有效地过滤字典

时间:2018-02-16 09:51:48

标签: python python-3.x dictionary

我们有一个字典d1和一个条件cond。我们希望d1仅包含满足条件cond的值。一种方法是:

d1 = {k:v for k,v in d1.items() if cond(v)}

但是,这会创建一个新的字典,如果d1很大,这可能会非常低效。

另一种选择是:

for k,v in d1.items():
    if not cond(v):
       d1.pop(k)

但是,这会在迭代时修改字典,并生成错误:"运行错误:字典在迭代期间改变了大小"。

Python 3中正确过滤字典的正确方法是什么?

1 个答案:

答案 0 :(得分:2)

如果没有多个密钥的相应值满足条件,那么您可能先聚合密钥然后修剪字典:

for k in [k for k,v in d1.items() if cond(v)]:
    del d1[k]

如果列表[k for k,v in d1.items() if cond(v)]太大,可能会“轮流”处理字典,即组装密钥直到其计数不超过阈值,修剪字典,并重复直到那里没有更多的钥匙满足条件:

from itertools import islice

def prune(d, cond, chunk_size = 1000):
    change = True
    while change:
        change = False

        keys = list(islice((k for k,v in d.items() if cond(v)), chunk_size))
        for k in keys:
            change = True
            del d[k]