阿特金的筛子出乎意料地缓慢

时间:2014-01-04 06:14:05

标签: c++ performance optimization sieve

我最近对素数非常感兴趣,并尝试制作程序来计算它们。我能够对Sundaram程序进行筛选,能够在几秒钟内计算出一百万个素数。我相信这很快,但我想要更好。我继续尝试制作一个Sieve of Atkin,在从维基百科复制伪代码后,我在20分钟内打了一个C ++代码。

我知道它不会是完美的,因为毕竟它的伪代码。我期待至少比我的Sundaram Sieve更好的时间,但我错了。这非常慢。我已多次查看,但我找不到任何可以做出的重大改变。在查看我的代码时,我知道它效率低下,我知道我使用了系统命令,我知道它已经到处都是,但这不是一个项目或任何重要的东西,它适合我。

#include <iostream>
#include <fstream>
#include <time.h>
#include <Windows.h>
#include <vector>

using namespace std;

int main(){

float limit;
float slimit;
long int n;
int counter = 0;
int squarenum;
int starttime;
int endtime;
vector <bool> primes;

ofstream save;
save.open("primes.txt");
save.clear();

cout << "Find all primes up to: " << endl;
cin >> limit;

slimit = sqrt(limit);

primes.resize(limit);

starttime = time(0);

// sets all values to false
for (int i = 0; i < limit; i++){

    primes[i] = false;
}


//puts in possible primes
for (int x = 1; x <= slimit; x++){

    for (int y = 1; y <= slimit; y++){


        n = (4*x*x) + (y*y);
        if (n <= limit && (n%12 == 1 || n%12 == 5)){

            primes[n] = !primes[n];
        }

        n = (3*x*x) + (y*y);
        if (n <= limit && n% 12 == 7){

            primes[n] = !primes[n];
        }

        n = (3*x*x) - (y*y);
        if ( x > y && n <= limit && n%12 == 11){

            primes[n] = !primes[n];
        }
    }
}

//square number mark all multiples not prime

for (float i = 5; i < slimit; i++){

    if (primes[i] == true){

        for (long int k = i*i; k < limit; k = k + (i*i)){

            primes[k] = false;
        }
    }
}

endtime = time(0);
cout << endl << "Calculations complete, saving in text document" << endl;


// loads to document
for (int i = 0 ; i < limit ; i++){

    if (primes[i] == true){


        save << counter << ") " << i << endl;
        counter++;
    }
}

save << "Found in " << endtime - starttime << " seconds" << endl;

save.close();

system("primes.txt");

system ("Pause");
return 0;
}

2 个答案:

答案 0 :(得分:2)

这不是一个答案(IMO,你已经在评论中得到了答案),但是比较的快速标准。 Eratosthenes 的筛子应该在一台相当现代化的机器上的中找到一百万个素数。

#include <vector>
#include <iostream>
#include <time.h>

unsigned long primes = 0;

int main() {
    // empirically derived limit to get 1,000,000 primes
    int number = 15485865; 

    clock_t start = clock();
    std::vector<bool> sieve(number,false);
    sieve[0] = sieve[1] = true;

    for(int i = 2; i<number; i++) {
        if(!sieve[i]) {
            ++primes;
            for (int temp = 2*i; temp<number; temp += i)
                sieve[temp] = true;
        }
    }
    clock_t stop = clock();

    std::cout.imbue(std::locale(""));
    std::cout << "Total primes: " << primes << "\n";
    std::cout << "Time: " << double(stop - start) / CLOCKS_PER_SEC << " seconds\n";
    return 0;
}

在我的笔记本电脑上运行,我得到的结果是:

Total primes: 1000000
Time: 0.106 seconds

显然,速度会因处理器,时钟速度等而有所不同,但对于任何合理现代的东西,我仍然期望不到一秒的时间。当然,如果您决定将素数写入文件,您可以期望增加一些时间,但即便如此,我预计总时间不到一秒 - 我的笔记本电脑的硬盘相对较慢,写出来这些数字只能达到约0.6秒。

答案 1 :(得分:0)

vector是一个bitset。更新不在高速缓存中的位集值是很昂贵的。尝试使用矢量,写入便宜得多。