使用以下格式的数据集:
dataset = {
"one" : { "a" : [ 0, 1, 2 ], "b" : [ 0,10,20 ] },
"two" : { "a" : [ 0, 1 ], "b" : [ 0 ] }
}
我正在寻找一种快速方法来总结所有“a”列表的长度(并最终为“b”相同)。
因此,对于上述数据集,我将寻找总和为5(因为“一个”[a]有3个成员而“两个”[a]有2个成员,3 + 2通常是5个。) / p>
我认为这样的事情可以胜任,但我得到了意想不到的结果(错误的数字):
print sum( len(e) for d in dataset for e in dataset[d]["a"] )
我认为这会依次获取“一”和“两个”,并且每个都会查找“a”的长度。然后它将计算找到的所有长度的总和。它没有,我应该使用什么?
答案 0 :(得分:7)
您只对每个级别的值感兴趣,所以只需迭代这些值:
>>> dataset = {
"one": {"a": [0, 1, 2], "b": [0, 10, 20]},
"two": {"a": [0, 1], "b": [0]}
}
>>> sum(len(lst) for dct in dataset.values() for lst in dct.values())
9
对于嵌套字典中的特定键:
>>> key = 'a'
>>> sum(len(dct[key]) for dct in dataset.values())
5
或者获取多个键的计数:
>>> {key: sum(len(dct[key]) for dct in dataset.values()) for key in 'ab'}
{'a': 5, 'b': 4}
答案 1 :(得分:2)
您可以使用这样的生成器表达式:
>>> sum(len(v['a']) for k, v in dataset.items())
5
答案 2 :(得分:0)
a,b = map(sum,zip(*((len(d["a"]),len(d["b"])) for d in dataset.values())))
print(a,b)
5 4
对python2使用itertools:
from itertools import imap,izip
a , b = imap(sum, izip(*((len(d["a"]),len(d["b"])) for d in dataset.itervalues())))
print(a,b)
5 4
如果可能存在不存在的密钥,请使用dict.get:
a, b = imap(sum, izip(*((len(d.get("a", [])), len(d.get("b",[]))) for d in dataset.itervalues())))