提示查找表设置位计数算法

时间:2012-10-02 05:03:03

标签: count binary numbers operations representation

我正在寻找设置位计数问题的解决方案(给定二进制数,如何有效地计算设置的位数)。

在这里http://graphics.stanford.edu/~seander/bithacks.html#CountBitsSetNaive,我找到了一些方法。

查找表方法怎么样?我不明白二进制表示/数字的哪些属性使它工作。

static const unsigned char BitsSetTable256[256] = 
{
#   define B2(n) n,     n+1,     n+1,     n+2
#   define B4(n) B2(n), B2(n+1), B2(n+1), B2(n+2)
#   define B6(n) B4(n), B4(n+1), B4(n+1), B4(n+2)
   B6(0), B6(1), B6(1), B6(2)
};

unsigned int v; // count the number of bits set in 32-bit value v
unsigned int c; // c is the total bits set in v

// Option 1:
c = BitsSetTable256[v & 0xff] + 
   BitsSetTable256[(v >> 8) & 0xff] + 
   BitsSetTable256[(v >> 16) & 0xff] + 
   BitsSetTable256[v >> 24]; 

// Option 2:
unsigned char * p = (unsigned char *) &v;
c = BitsSetTable256[p[0]] + 
    BitsSetTable256[p[1]] + 
    BitsSetTable256[p[2]] + 
    BitsSetTable256[p[3]];


// To initially generate the table algorithmically:
BitsSetTable256[0] = 0;
for (int i = 0; i < 256; i++)
{
   BitsSetTable256[i] = (i & 1) + BitsSetTable256[i / 2];
}

特别是,我最初并不理解BitsSetTable256定义。为什么定义这些数量B2,B4,......?在我看来,他们以后不会被使用。

您能否提供有关二进制表示的更多文档?

谢谢!

1 个答案:

答案 0 :(得分:6)

定义是按模式形成表格。它们是递归宏,B6使用B4而B4使用B2。 B6(0)将被分解为:

B4(0), B4(1), B4(1), B4(2)

B4(0)将被分解为:

0, 1, 1, 2

序列的前几个数字将是:

// 0, 1, 2, 3, 4, 5, 6, 7, 8, 9,10,11
   0, 1, 1, 2, 1, 2, 2, 3, 1, 2, 2, 3

如您所见,这些是为表中的每个索引设置的位数。

算法的其余部分是您将数字分成8位块并将每个块中设置的位数相加,这就是这些线的含义(您可以根据自己的喜好使用选项1或选项2,不是两个):

// Option 1:
c = BitsSetTable256[v & 0xff] + 
    BitsSetTable256[(v >> 8) & 0xff] + 
    BitsSetTable256[(v >> 16) & 0xff] + 
    BitsSetTable256[v >> 24]; 

// Option 2:
unsigned char * p = (unsigned char *) &v;
c = BitsSetTable256[p[0]] + 
    BitsSetTable256[p[1]] + 
    BitsSetTable256[p[2]] + 
    BitsSetTable256[p[3]];

底部的代码:

// To initially generate the table algorithmically:
BitsSetTable256[0] = 0;
for (int i = 0; i < 256; i++)
{
   BitsSetTable256[i] = (i & 1) + BitsSetTable256[i / 2];
}

是生成BitsSetTable256的另一种方法。它在运行时而不是在编译时生成表(这是宏定义的作用。

P.S。如果你的目标是足够的(SSE4)x86,你可以使用POPCNT指令。