Numpy项目Euler 1广义优化

时间:2015-12-06 11:01:15

标签: python numpy optimization generalization

我已经开始学习Numpy,我正在寻找一些方法来写这个。我写了一个Euler 1的概括。它有一个除数和数字列表,例如[3,5]和Euler 1中的1000。

天真的纯蟒:

def subn1(divisors, n):
    return sum(i for i in range(1,n) if not all(i % d for d in divisors))

对于范围(2,20),1000000,这大约需要2.5秒。

我迄今为止的第一个也是最好的尝试看起来像这样:

def subn2(divisors, n):
    a = np.arange(1,n) 
    b = np.zeros(a.shape[0], dtype=bool) 
    for d in divisors:
        b += a % d == 0
    return np.sum(a[b]) 

并且在范围(2,20),1000000。

中大约0.45秒运行

我的第三次尝试是移除了foor循环并使用纯粹的numpy,但它在速度部门中丢失了一小部分并且使用了更多的内存。

def subn3(divisors, n):
    nums = np.arange(1,n)     
    divs = np.array([divisors]).T
    return np.sum(nums[np.logical_or.reduce(np.mod(nums, divs) == 0, axis=0)])

对于范围(2,20),100000,这在约.5秒内运行。

是否有更快的方式在“纯粹的”numpy中写它或者是不要回避的foor循环?

注意:我知道你可以通过减少除数列表来优化它,所以没有必要对它进行评论:)

2 个答案:

答案 0 :(得分:0)

使用broadcasting -

的一种NumPythonic矢量化方法
def subn_broadcasting(divisors,n):
    a = np.arange(1,n)
    return (a[(a % np.array(divisors)[:,None] == 0).any(0)]).sum()

运行时测试和验证 -

In [14]: # Inputs
    ...: n = 1000
    ...: divisors = range(2,20)
    ...: 

In [15]: print subn1(divisors, n)
    ...: print subn2(divisors, n)
    ...: print subn3(divisors, n)
    ...: print subn_broadcasting(divisors, n)
    ...: 
416056
416056
416056
416056

In [16]: %timeit subn1(divisors, n)
    ...: %timeit subn2(divisors, n)
    ...: %timeit subn3(divisors, n)
    ...: %timeit subn_broadcasting(divisors, n)
    ...: 
1000 loops, best of 3: 1.39 ms per loop
1000 loops, best of 3: 480 µs per loop
1000 loops, best of 3: 434 µs per loop
1000 loops, best of 3: 428 µs per loop

嗯,在n2n3版本上看起来并没有那么大的改进。

答案 1 :(得分:0)

您可以使用np.where,如下所示:

def subn4(divisors, n):
    a = np.arange(np.min(divisors),n) 
    b = np.zeros(a.shape[0], dtype=bool) 
    for d in divisors:
        b += a % d == 0
    return np.sum(a[np.where(b)])

def subn4_(divisors, n):
    a = np.arange(1,n) 
    b = np.zeros(a.shape[0], dtype=bool) 
    for d in divisors:
        b += a % d == 0
    return np.sum(a[np.where(b)]) 

测试,如前所述:

%timeit subn1(divisors, n)
%timeit subn2(divisors, n)
%timeit subn3(divisors, n)
%timeit subn_broadcasting(divisors, n)
%timeit subn4(divisors, n)
%timeit subn4_(divisors, n)


1 loops, best of 3: 596 ms per loop
10 loops, best of 3: 30.1 ms per loop
10 loops, best of 3: 32 ms per loop
10 loops, best of 3: 31.9 ms per loop
10 loops, best of 3: 28.2 ms per loop
10 loops, best of 3: 27.4 ms per loop