Question

有没有一种简单的方法来计算Python中几个（相同长度）列表的平均值？说，我有[[1, 2, 3], [5, 6, 7]]，并希望获得[3,4,5]。这要做10万次，所以要快点。

Answer 1

如果您使用numpy（这似乎更合适）：</ p>

>>> import numpy as np
>>> data = np.array([[1, 2, 3], [5, 6, 7]])
>>> np.average(data, axis=0)
array([ 3.,  4.,  5.])

Answer 2

In [6]: l = [[1, 2, 3], [5, 6, 7]]

In [7]: [(x+y)/2 for x,y in zip(*l)]
Out[7]: [3, 4, 5]

（您需要决定是否需要整数或浮点数学，以及使用哪种除法。）

在我的电脑上，上面需要1.24us：

In [11]: %timeit [(x+y)/2 for x,y in zip(*l)]
1000000 loops, best of 3: 1.24 us per loop

因此，处理100,000个输入将需要0.124秒。

有趣的是，NumPy阵列在如此小的输入上速度较慢：

In [27]: In [21]: a = np.array(l)

In [28]: %timeit (a[0] + a[1]) / 2
100000 loops, best of 3: 5.3 us per loop

In [29]: %timeit np.average(a, axis=0)
100000 loops, best of 3: 12.7 us per loop

如果输入变大，相对时间无疑会发生变化。

Answer 3

扩展NPE答案，对于包含您想要平均的n子列表的列表，使用它（一个numpy解决方案可能更快，但我只使用内置插件）：

def average(l):
    llen = len(l)
    def divide(x): return x / llen
    return map(divide, map(sum, zip(*l)))

这会汇总所有子列表，然后将结果除以子列表的数量，从而产生平均值。您可以内联len计算并将divide转换为类似lambda x: x / len(l)的lambda，但使用显式函数并预先计算长度应该更快一些。

Python：快速计算几个（相同长度）列表的平均值？

3 个答案: