我对多年来寻找更好的素数识别器的问题感兴趣。我意识到这是一个巨大的学术研究和学习领域 - 我对此感兴趣只是为了好玩。这是我在C(下面)中首次尝试可能的解决方案。
我的问题是,你能否提出改进建议(不引用网上的其他参考资料,我正在寻找实际的C代码)?我想从中获得的是更好地理解确定这样的解决方案的性能复杂性。
我是否正确地断定这个解决方案的复杂性是O(n ^ 2)?
#include <stdio.h>
#include <math.h>
/* isprime */
/* Test if each number in the list from stdin is prime. */
/* Output will only print the prime numbers in the list. */
int main(int argc, char* argv[]) {
int returnValue = 0;
int i;
int ceiling;
int input = 0;
int factorFound = 0;
while (scanf("%d", &input) != EOF) {
ceiling = (int)sqrt(input);
if (input == 1) {
factorFound = 1;
}
for (i = 2; i <= ceiling; i++) {
if (input % i == 0) {
factorFound = 1;
}
}
if (factorFound == 0) {
printf("%d\n", input);
}
factorFound = 0;
}
return returnValue;
}
答案 0 :(得分:10)
for (i = 2; i <= ceiling; i++) {
if (input % i == 0) {
factorFound = 1;
break;
}
}
这是第一个改进,仍然保持在“相同”算法的范围内。它根本不需要任何数学就可以看到这个。
除此之外,一旦你看到input
不能被2整除,就没有必要检查4,6,8等等。如果任何偶数被分成input
,那么肯定2会有,因为它除了所有偶数。
如果你想稍微超出算法范围,可以使用Sheldon L. Cooper在答案中提供的循环。 (这比让他从评论中纠正我的代码更容易,尽管他的努力非常受欢迎)
这利用了以下事实:对于某些正整数n*6 + 1
,除2和3之外的每个素数都具有n*6 - 1
或n
的形式。要注意这一点,请注意,如果m = n*6 + 2
或m = n*6 + 4
,那么n
可以被2整除,如果m = n*6 + 3
则可以被3整除。
事实上,我们可以更进一步。如果p1, p2, .., pk
是第一个k
素数,则所有与其产品互质的整数都会标出所有剩余素数必须适合的'时段'。
要看到这一点,只需让k#
成为pk
之前所有素数的乘积。然后,如果gcd(k#, m) = g
,g
除以n*k# + m
,那么如果g != 1
,这个总和就会非常复杂。所以如果你想用5# = 30
进行迭代,那么你的互质整数分别为1,7,11,13,17,19,23和29。
如果g = gcd(k#, m)
,那么对于任何整数,n
,g
除以n*k# + m
因为它除k#
所以它必须除n*k#
。但它也将m
分开,所以它必须除以总和。上面我只为n = 1
证明了这一点。我的坏。
另外,我应该注意到,这并没有改变算法的基本复杂性,它仍然是O(n ^ 1/2)。它所做的只是彻底减少用于计算实际预期运行时间的系数。
答案 1 :(得分:7)
算法中每个素性测试的时间复杂度为O(sqrt(n))
。
您可以始终使用以下事实:除了2和3之外的所有素数都是以下形式:6*k+1
或6*k-1
。例如:
int is_prime(int n) {
if (n <= 1) return 0;
if (n == 2 || n == 3) return 1;
if (n % 2 == 0 || n % 3 == 0) return 0;
int k;
for (k = 6; (k-1)*(k-1) <= n; k += 6) {
if (n % (k-1) == 0 || n % (k+1) == 0) return 0;
}
return 1;
}
此优化不会改善渐近复杂度。
修改强>
鉴于你的代码中你反复测试数字,你可能想要预先计算一个素数列表。只有4792个素数小于或等于INT_MAX的平方根(假设为32位整数)。
此外,如果输入数字相对较小,您可以尝试计算sieve。
以下是两种想法的组合:
#define UPPER_BOUND 46340 /* floor(sqrt(INT_MAX)) */
#define PRIME_COUNT 4792 /* number of primes <= UPPER_BOUND */
int prime[PRIME_COUNT];
int is_prime_aux[UPPER_BOUND];
void fill_primes() {
int p, m, c = 0;
for (p = 2; p < UPPER_BOUND; p++)
is_prime_aux[p] = 1;
for (p = 2; p < UPPER_BOUND; p++) {
if (is_prime_aux[p]) {
prime[c++] = p;
for (m = p*p; m < UPPER_BOUND; m += p)
is_prime_aux[m] = 0;
}
}
}
int is_prime(int n) {
if (n <= 1) return 0;
if (n < UPPER_BOUND) return is_prime_aux[n];
int i;
for (i = 0; i < PRIME_COUNT && prime[i]*prime[i] <= n; i++)
if (n % prime[i] == 0)
return 0;
return 1;
}
在开始处理查询之前,在程序开头调用fill_primes
。它运行得非常快。
答案 2 :(得分:4)
那里的代码只有复杂度O(sqrt(n)lg(n))。如果你假设基本的数学运算是O(1)(直到你开始使用bignums为真),那么它只是O(sqrt(n))。
请注意,素数测试可以在比O(sqrt(n)lg(n))更快的时间内执行。 This site有许多AKS primality test的实现,已经证明它们在O((log n)^ 12)时间内运行。
还有一些非常非常快速的probalistic测试 - 虽然速度很快,但它们有时会给出不正确的结果。例如,Fermat primality test:
如果我们想要测试素数
p
,请选择一个随机数a
,并测试是否a^(p-1) mod p = 1
。如果为false,p
绝对不是素数。如果为true,则p
可能是 prime。通过使用a
的不同随机值重复测试,可以降低误报的概率。
请注意,此特定测试有一些缺陷 - 有关详细信息,请参阅维基百科页面,以及您可以使用的其他概率素性测试。
如果你想坚持当前的方法,仍然可以做出一些小的改进 - 正如其他人所指出的那样,在2
之后,所有其他的素数都是奇数,所以你可以跳过两个循环中一次的潜在因素。当您找到一个因素时,您也可以立即突破。但是,这并不会改变算法的渐近最坏情况行为,它保持在O(sqrt(n)lg(n)) - 它只是改变最佳情况(到O(lg(n))),并且将常数因子减少大约一半。
答案 3 :(得分:2)
一个简单的改进是将for循环改为在找到一个因子时突破:
for (i = 2; i <= ceiling && !factorFound; i++) {
if (input % i == 0) {
factorFound = 1;
另一种可能性是将计数器增加2(在检查2本身之后)。
答案 4 :(得分:2)
你能否提出改进建议
这里你去...不是算法,而是程序本身:)
argc
和argv
,请摆脱它们== 1
,而不是!= EOF
sqrt()
returnValue
不需要,您可以返回常量:return 0;
main()
函数中包含所有功能,而是将程序与您能想到的功能分开。答案 5 :(得分:0)
偶数(2除外)不能是素数。因此,一旦我们知道数字不均匀,我们就可以检查奇数是否是它的因素。
for (i = 3; i <= ceiling; i += 2) {
if (input % i == 0) {
factorFound = 1;
break;
}
}
答案 6 :(得分:0)
您可以对算法进行小切割,而不会增加太多的代码复杂性。 例如,您可以跳过验证中的偶数,并在找到因素后立即停止搜索。
if (input < 2 || (input != 2 && input % 2 == 0))
factorFound = 1;
if (input > 3)
for (i = 3; i <= ceiling && !factorFound; i += 2)
if (input % i == 0)
factorFound = 1;
关于复杂性,如果n
是您的输入数字,那么复杂性不是O(sqrt(n)),因为您大致在大多数sqrt(n)分区和比较中进行?
答案 7 :(得分:0)
您的计划的时间复杂度为O(n*m^0.5)
。使用n
输入中的素数。 m
输入中最大素数的大小,如果您愿意,可以MAX_INT
。所以复杂性也可以写成O(n)
,其中n要检查的素数。
对于Big-O,n
(通常)是输入的大小,在您的情况下,将是要检查的素数。如果我将这个列表大两倍(例如复制它),则需要(+ - )正好两倍,因此O(n)
。
答案 8 :(得分:0)
这是我的算法,复杂性仍然是O(n^0.5)
,但我设法删除代码中的一些昂贵的操作......
算法最慢的部分是modulus
操作,我设法消除sqrt
或执行i * i <= n
这样我就可以节省宝贵的周期......这是基于sum of odd numbers is always a perfect square.
既然我们正在迭代odd numbers
,为什么不利用它呢? :)
int isPrime(int n)
{
int squares = 1;
int odd = 3;
if( ((n & 1) == 0) || (n < 9)) return (n == 2) || ((n > 1) && (n & 1));
else
{
for( ;squares <= n; odd += 2)
{
if( n % odd == 0)
return 0;
squares+=odd;
}
return 1;
}
}
答案 9 :(得分:0)
#include <stdio.h>
#include <math.h>
int IsPrime (int n) {
int i, sqrtN;
if (n < 2) { return 0; } /* 1, 0, and negatives are nonprime */
if (n == 2) { return 2; }
if ((n % 2) == 0) { return 0; } /* Check for even numbers */
sqrtN = sqrt((double)n)+1; /* We don't need to search all the way up to n */
for (i = 3; i < sqrtN; i += 2) {
if (n % i == 0) { return 0; } /* Stop, because we found a factor! */
}
return n;
}
int main()
{
int n;
printf("Enter a positive integer: ");
scanf("%d",&n);
if(IsPrime(n))
printf("%d is a prime number.",n);
else
printf("%d is not a prime number.",n);
return 0;
}
答案 10 :(得分:-2)
无法改进算法。可能有很小的方法来改进您的代码,但不是算法的基本速度(和复杂性)。
编辑:当然,因为他不需要知道所有因素,只要它是否是素数。很棒。