我有一个公共笔记本,其中python,numpy,numba,cython和fortran通过简单求和进行比较:
https://gist.github.com/denfromufa/7727874c4fe1e7e174ed953930e93bbc
为什么numba这么快?
答案 0 :(得分:3)
正如@DavidW指出的那样,你并没有真正对相同算法进行比较。下面我为每个cython和numba编写了两个单独的函数来执行相同的操作。第一个是在数组上运行,第二个是给定一个整数:
用Cython:
cpdef long cy_sum(long[:] A):
cdef long i, n = A.shape[0], s = 0
for i in range(n):
s += A[i]
return s
cpdef long cy_sum2(long i):
cdef long s, x
s = 0
for x in range(i):
s += x
return s
Numba:
@nb.jit(nopython=True)
def nb_sum(A):
s=0
n = A.shape[0]
for i in range(n):
s += A[i]
return s
@nb.jit(nopython=True)
def nb_sum2(i):
s=0
for x in range(i):
s+=x
return s
测试以确保它们给出相同的结果:
N = int(1e6)
d = np.arange(N, dtype=np.int64)
print np.allclose(nb_sum(d), cy_sum(d)) # True
print np.allclose(nb_sum2(N), cy_sum2(N)) # True
我硬件上的时间安排:
%timeit cy_sum(d)
%timeit nb_sum(d)
1000 loops, best of 3: 416 µs per loop
1000 loops, best of 3: 237 µs per loop
%timeit cy_sum2(N)
%timeit nb_sum2(N)
10000000 loops, best of 3: 63.5 ns per loop
10000000 loops, best of 3: 187 ns per loop
我不会从这样的微基准中得出太多结论,但至少现在正在比较等效的实现。