long long int使我的Eratosthenes筛子超级慢?

时间:2017-08-30 06:13:00

标签: c performance sieve-of-eratosthenes sieve

我有一个程序要求我查找到10**10-1 (10,000,000,000)之前的素数。我写了一个Eratosthenes筛子来做这件事,它的工作非常好(而且准确)高达10**9 (1,000,000,000)。我通过计算它找到的素数来确认它的准确性,并且它与the chart found here.上的should technically be large enough的值相匹配,我使用unsigned int作为存储类型,它在大约30秒内成功找到所有质数。

但是,10**10要求我使用更大的存储类型:long long int。一旦我切换到这个,程序运行速度明显变慢(它已经3小时加上它仍在工作)。以下是相关代码:

typedef unsigned long long ul_long;
typedef unsigned int u_int;

ul_long max = 10000000000;                            
u_int blocks = 1250000000;
char memField[1250000000];     

char mapBit(char place) {             //convert 0->0x80, 1->0x40, 2->0x20, and so on
    return 0x80 >> (place);
}

for (u_int i = 2; i*i < max; i++) {

    if (memField[i / 8] & activeBit) {               //Use correct memory block
        for (ul_long n = 2 * i; n < max; n += i) {
            char secondaryBit = mapBit(n % 8);       //Determine bit position of n
            u_int activeByte = n / 8;                //Determine correct memory block
            if (n < 8) {                             //Manual override memory block and bit for first block
                secondaryBit = mapBit(n);
                activeByte = 0;
            }
            memField[activeByte] &= ~(secondaryBit);  //Set the flag to false
        }
    }
    activeBit = activeBit >> 1;                       //Check the next
    if (activeBit == 0x00) activeBit = 0x80;
} 

我认为,因为10**1010**9大10倍,所以它应该花费10倍的时间。这个缺陷在哪里?为什么更改为long long导致如此重大的性能问题以及如何解决此问题?我认识到数字会变大,所以它应该稍慢一点,但只是到最后。有什么我想念的东西。

注意:我意识到long int enter image description here但我的limits.h表示,即使我正在编译64位,它也不是。这就是为什么我使用long long int以防万一有人在想。另外,请记住,我没有计算机科学培训,只是一个业余爱好者。

编辑:只需在&#34;发布&#34;中运行它作为x86-64,建议使用一些调试语句。我得到了以下输出:

Http_API

看起来我点击了u_int界限。我不知道为什么i会变得那么大。

1 个答案:

答案 0 :(得分:12)

您的程序在for (u_int i = 2; i*i < max; i++)中有一个无限循环。 iunsigned int,因此i*i包裹在32位且始终小于max。将i设为ul_long

请注意,对于位0到7,应使用从1到0x80的更简单的位模式。

以下是完整版本:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

typedef unsigned long long ul_long;
typedef unsigned int u_int;

#define TESTBIT(a, bit)   (a[(bit) / 8] & (1 << ((bit) & 7)))
#define CLEARBIT(a, bit)  (a[(bit) / 8] &= ~(1 << ((bit) & 7)))

ul_long count_primes(ul_long max) {
    size_t blocks = (max + 7) / 8;
    unsigned char *memField = malloc(blocks);
    if (memField == NULL) {
        printf("cannot allocate memory for %llu bytes\n",
               (unsigned long long)blocks);
        return 0;
    }
    memset(memField, 255, blocks);
    CLEARBIT(memField, 0);  // 0 is not prime
    CLEARBIT(memField, 1);  // 1 is not prime
    // clear bits after max
    for (ul_long i = max + 1; i < blocks * 8ULL; i++) {
        CLEARBIT(memField, i);
    }

    for (ul_long i = 2; i * i < max; i++) {
        if (TESTBIT(memField, i)) {           //Check if i is prime
            for (ul_long n = 2 * i; n < max; n += i) {
                CLEARBIT(memField, n);                   //Reset all multiples of i
            }
        }
    }
    unsigned int bitCount[256];
    for (int i = 0; i < 256; i++) {
        bitCount[i] = (((i >> 0) & 1) + ((i >> 1) & 1) +
                       ((i >> 2) & 1) + ((i >> 3) & 1) +
                       ((i >> 4) & 1) + ((i >> 5) & 1) +
                       ((i >> 6) & 1) + ((i >> 7) & 1));
    }
    ul_long count = 0;
    for (size_t i = 0; i < blocks; i++) {
        count += bitCount[memField[i]];
    }
    printf("count of primes up to %llu: %llu\n", max, count);
    free(memField);
    return count;
}

int main(int argc, char *argv[]) {
    if (argc > 1) {
        for (int i = 1; i < argc; i++) {
            count_primes(strtoull(argv[i], NULL, 0));
        }
    } else {
        count_primes(10000000000);
    }
    return 0;
}

10 ^ 10完成,10 ^ 10完成131秒,

count of primes up to 1000000000: 50847534
count of primes up to 10000000000: 455052511