模数优化c

时间:2015-01-17 19:25:19

标签: c optimization modulus

我试图在我知道的整数集上对模运算进行优化 分频器为400-3500,分红为正整数,最高为2 ^ 16

我听说过黑客喜欢的魔法数字,但我无法找到一种方法来获得一般数字模数的幻数。

如果不是魔术数字,我可以根据数字上的信息进行优化吗?

3 个答案:

答案 0 :(得分:4)

你提到Hackers Delight,它有答案。请参见“按常量划分整数,并入编译器(无符号)”部分。实现它。

然后,当然,每次进行模数时​​都不要运行,这比天真模数差得多。为400-3500得到一个结果数组,然后在计算模数时,从该数组中取出参数。

那里给出的代码是

struct mu {unsigned M;     // Magic number, 
          int a;           // "add" indicator, 
          int s;};         // and shift amount. 

struct mu magicu(unsigned d) {
                           // Must have 1 <= d <= 2**32-1. 
   int p; 
   unsigned nc, delta, q1, r1, q2, r2; 
   struct mu magu; 

   magu.a = 0;             // Initialize "add" indicator. 
   nc = -1 - (-d)%d;       // Unsigned arithmetic here. 
   p = 31;                 // Init. p. 
   q1 = 0x80000000/nc;     // Init. q1 = 2**p/nc. 
   r1 = 0x80000000 - q1*nc;// Init. r1 = rem(2**p, nc). 
   q2 = 0x7FFFFFFF/d;      // Init. q2 = (2**p - 1)/d. 
   r2 = 0x7FFFFFFF - q2*d; // Init. r2 = rem(2**p - 1, d). 
   do {
      p = p + 1; 
      if (r1 >= nc - r1) {
         q1 = 2*q1 + 1;            // Update q1. 
         r1 = 2*r1 - nc;}          // Update r1. 
      else {
         q1 = 2*q1; 
         r1 = 2*r1;} 
      if (r2 + 1 >= d - r2) {
         if (q2 >= 0x7FFFFFFF) magu.a = 1; 
         q2 = 2*q2 + 1;            // Update q2. 
         r2 = 2*r2 + 1 - d;}       // Update r2. 
      else {
         if (q2 >= 0x80000000) magu.a = 1; 
         q2 = 2*q2; 
         r2 = 2*r2 + 1;} 
      delta = d - 1 - r2; 
   } while (p < 64 && 
           (q1 < delta || (q1 == delta && r1 == 0))); 

   magu.M = q2 + 1;        // Magic number 
   magu.s = p - 32;        // and shift amount to return 
   return magu;            // (magu.a was set above). 
}

通过x获取数字y的模数的方法就像(未经过测试,检查)

uint64_t n = x;
// do division
n = ((n + magic[y].a) * magic[y].M) >> (32 + magic[y].s);
// get remainder
return x - y * n;

使用16位幻数可能比这更好,因此不会涉及64位整数。

答案 1 :(得分:0)

n = ((n + magic[y].a) * magic[y].M) >> (32 + magic[y].s);

当添加指示符为1时,这不起作用。遵循Hacker's Delight(第10-10节),配额(此处标记为q)计算如下:

q = floor(M*n/2^32)
q = q >> s

如果a = 0,则

q = floor(M*n/2^32)
t = (q+n)>>1    // (q+n)/2
q = t >> (s-1)

如果a = 1.这可以写成:

q = ((M*n)>>32 + a*n) >> s

或者,遵循哈罗德的记法:

n = (((n * magic[y].M) >> 32) + n * magic[y].a) >> magic[y].s;

答案 2 :(得分:-2)

推荐以下内容作为可以传递给编译器的唯一有用的事情是知道操作数在有限的16位范围内。否则让编译器优化。

#include <stdint.h>
inline uint_fast16_t fast_mod(uint_fast16_t dividend, uint_fast16_t divisor) {
  return dividend % divisor;
}