我们有一个字典d1
和一个条件cond
。我们希望d1仅包含满足条件cond
的值。一种方法是:
d1 = {k:v for k,v in d1.items() if cond(v)}
但是,这会创建一个新的字典,如果d1
很大,这可能会非常低效。
另一种选择是:
for k,v in d1.items():
if not cond(v):
d1.pop(k)
但是,这会在迭代时修改字典,并生成错误:"运行错误:字典在迭代期间改变了大小"。
Python 3中正确过滤字典的正确方法是什么?
答案 0 :(得分:2)
如果没有多个密钥的相应值满足条件,那么您可能先聚合密钥然后修剪字典:
for k in [k for k,v in d1.items() if cond(v)]:
del d1[k]
如果列表[k for k,v in d1.items() if cond(v)]
太大,可能会“轮流”处理字典,即组装密钥直到其计数不超过阈值,修剪字典,并重复直到那里没有更多的钥匙满足条件:
from itertools import islice
def prune(d, cond, chunk_size = 1000):
change = True
while change:
change = False
keys = list(islice((k for k,v in d.items() if cond(v)), chunk_size))
for k in keys:
change = True
del d[k]