如何找到10 ^ 12以下所有素数的总和?
我使用O(n * log(log(n)))
的Eratosthenes筛,但我想要一个算法来更快地计算它。
我的代码在4秒内运行10 ^ 8,但计算10 ^ 12需要花费数小时。
这是我的代码:
#include <iostream>
#include <vector>
#include <algorithm>
#define big long long int
#define ubig unsigned long long
#define SZ(x) int(x.size())
#define Pb push_back
using namespace std;
const big maxn = 1000 * 1000 + 10;
const big mod = 100000000;
const big Delta = 100000000;
bool s[mod], p[maxn];
big b[maxn];
vector <big> primes;
ubig ans = 0, n;
void init_primes () {
for (big i = 2; i <= 1000 * 1000; i++) {
if (p[i]) continue;
primes.Pb(i);
b[SZ(primes)-1] = primes.back() * primes.back();
for (big j = i * i; j <= 1000 * 1000; j += i) {
p[j] = 1;
}
}
}
void sieve (big from, big to) {
cerr << to / mod << " of " << n / mod << "\n" ;
fill (s,s+mod,0);
for (big i = 0; i < SZ(primes) && primes[i] <= to; i++) {
big j = b[i];
for (; j <= to; j += primes[i]) {
s[j%mod] = 1;
}
if (j >= b[i]) {
b[i] = j;
}
}
for (big k = 0; k < mod; k++) {
if (s[k] == 0) {
ans += from + k;
// ans %= Delta;
}
}
}
int main () {
init_primes();
n = 1000ll * 1000 * 1000 * 1000;
// cin >> n;
for (big i = 0; i + mod <= n; i += mod) {
sieve (i,i+mod);
}
cout << ans-1 << endl;
}
漫长的溢出现在无关紧要!
答案 0 :(得分:2)
我看到了两种显而易见的加速算法的方法。
首先,您使用1000 * 1000
作为循环的限制。最好进行一次计算:big limit = 1000 * 1000;
并在循环中使用变量limit
。根据您的编译器,您可能会在每次循环时重复乘法。
其次,你将你的i-loop踩到1.不要这样做。分别处理i=2
的情况,然后从i=3
循环,每次步进2。这将使外循环的迭代次数减半。为了进一步节省成本,请参考&#34;车轮分解&#34;方法
你可能想尝试使p []成为一个位数组,而不是一个布尔数组来节省内存使用量。您的速度问题可能是由于内存过载和磁盘交换过多造成的。