我需要计算numpy
数组中零元素的数量。我知道numpy.count_nonzero函数,但似乎没有用于计算零元素的模拟函数。
我的数组不是很大(通常小于1E5元素),但操作执行了数百万次。
当然我可以使用len(arr) - np.count_nonzero(arr)
,但我想知道是否有更有效的方法。
这是我目前如何做的MWE:
import numpy as np
import timeit
arrs = []
for _ in range(1000):
arrs.append(np.random.randint(-5, 5, 10000))
def func1():
for arr in arrs:
zero_els = len(arr) - np.count_nonzero(arr)
print(timeit.timeit(func1, number=10))
答案 0 :(得分:22)
更快一点的方法是使用np.count_nonzero()
,但根据需要使用条件。
In [3]: arr
Out[3]:
array([[1, 2, 0, 3],
[3, 9, 0, 4]])
In [4]: np.count_nonzero(arr==0)
Out[4]: 2
In [5]:def func_cnt():
for arr in arrs:
zero_els = np.count_nonzero(arr==0)
# here, it counts the frequency of zeroes actually
您也可以使用np.where
,但速度比np.count_nonzero()
In [6]: np.where( arr == 0)
Out[6]: (array([0, 1]), array([2, 2]))
In [7]: len(np.where( arr == 0))
Out[7]: 2
效率:(按降序排列)
In [8]: %timeit func_cnt()
10 loops, best of 3: 29.2 ms per loop
In [9]: %timeit func1()
10 loops, best of 3: 46.5 ms per loop
In [10]: %timeit func_where()
10 loops, best of 3: 61.2 ms per loop