Pythonic计算计数器中值的均值和方差的方法

时间:2015-07-13 19:40:36

标签: python performance counter

我想知道是否有一种Pythonic方法来计算计数器的均值和方差?

例如,我有四个计数器共享相同的键:

a = Counter({1: 23, 2: 39, 3: 1})
b = Counter({1: 28, 2: 39, 3: 1})
c = Counter({1: 23, 2: 39, 3: 2})
d = Counter({1: 23, 2: 22, 3: 1})

我的方法是:

each_key_val = {}

for i in a.keys():  # The assumption here is that all Counters must share the same keys
    for j in [a, b, c, d]:
        try:
            each_key_val[i].append(j[i])       
        except:
            each_key_val[i] = [j[i]]

我可以使用以下代码查找每个键的均值/方差:

 np.mean(each_key_val[i])
 np.var(each_key_val[i])

与我的方式相比,是否有更简单的方法来计算每个键的均值/方差?

1 个答案:

答案 0 :(得分:3)

并不是说我认为以下内容比您拥有的内容更具可读性,但它只使用列表推导。

说你有

cs = (a, b, c, d)

然后可以找到

的字典
m = {k: float(d) / len(cs) for k, d in sum(cs).iteritems()}

对于方差,请注意,definition of variance V [X] = E [x 2 ] - (E [X]) 2 ,所以,如果你定义:

p = sum([Counter({k: ((float(d**2) / len(cs))) for (k, d) in cn.iteritems()}) \
     for cn in cs])

然后方差字典

{k: p[k] - m[k]**2 for k in m}