Python中的Eratosthenes筛非常慢

时间:2016-01-04 15:54:53

标签: python algorithm performance sieve-of-eratosthenes

我用Python编写了一个程序,找到了给定数字( n )以下的所有素数,然后总结它们(回答 Project Euler' s问题10 )。为了解决这个问题,我需要将2,000,000以下的所有素数加起来。我的程序有效,但似乎非常低效(当 n = 2,000,000时,它甚至在30分钟后仍未显示答案)。我找到了另一个快得多的程序,虽然我似乎无法找出是什么让我的速度慢于我发现的速度。以下是两个程序:

慢节目(我写的那个):

def print_sum(n):

    prime_array = {}
    sum = 0

    for i in range(2, n+1):
        prime_array[i] = 1

    prime_array[0] = 0
    prime_array[1] = 0

    for j in range(2, int(math.sqrt(n)) + 1):
        if prime_array[j] == 1:
            for k in range(2, n + 1):
                prime_array[j*k] = 0

    for x in prime_array:
        if prime_array[x] == 1:
            sum = sum + x

    print sum

print_sum(2000000)

快速计划:

n = 2000000
prime_array = [True] * n
sum = 0

def mark(prime_array, x):
    for i in xrange(x+x, len(prime_array), x):
        prime_array[i] = False


for x in xrange(2, int(len(prime_array)** .5) + 1):
    if prime_array[x]: mark(prime_array, x)

for y in xrange(2, n):
    if prime_array[y]:
        sum = sum + y

print sum

提前致谢!

1 个答案:

答案 0 :(得分:7)

        for k in range(2, n + 1):
            prime_array[j*k] = 0

看起来你正在通过这个循环超越有用的范围。假设j为999,n为1,000,000。然后prime_array将拥有高达999,000,000的密钥,即使您只关心从0到1,000,000的密钥。

尝试将您的作业限制为低于n的值。

        for k in range(2*j, n + 1, j):
            prime_array[k] = 0