我正在寻找设置位计数问题的解决方案(给定二进制数,如何有效地计算设置的位数)。
在这里http://graphics.stanford.edu/~seander/bithacks.html#CountBitsSetNaive,我找到了一些方法。
查找表方法怎么样?我不明白二进制表示/数字的哪些属性使它工作。
static const unsigned char BitsSetTable256[256] =
{
# define B2(n) n, n+1, n+1, n+2
# define B4(n) B2(n), B2(n+1), B2(n+1), B2(n+2)
# define B6(n) B4(n), B4(n+1), B4(n+1), B4(n+2)
B6(0), B6(1), B6(1), B6(2)
};
unsigned int v; // count the number of bits set in 32-bit value v
unsigned int c; // c is the total bits set in v
// Option 1:
c = BitsSetTable256[v & 0xff] +
BitsSetTable256[(v >> 8) & 0xff] +
BitsSetTable256[(v >> 16) & 0xff] +
BitsSetTable256[v >> 24];
// Option 2:
unsigned char * p = (unsigned char *) &v;
c = BitsSetTable256[p[0]] +
BitsSetTable256[p[1]] +
BitsSetTable256[p[2]] +
BitsSetTable256[p[3]];
// To initially generate the table algorithmically:
BitsSetTable256[0] = 0;
for (int i = 0; i < 256; i++)
{
BitsSetTable256[i] = (i & 1) + BitsSetTable256[i / 2];
}
特别是,我最初并不理解BitsSetTable256
定义。为什么定义这些数量B2,B4,......?在我看来,他们以后不会被使用。
您能否提供有关二进制表示的更多文档?
谢谢!
答案 0 :(得分:6)
定义是按模式形成表格。它们是递归宏,B6使用B4而B4使用B2。 B6(0)将被分解为:
B4(0), B4(1), B4(1), B4(2)
B4(0)将被分解为:
0, 1, 1, 2
序列的前几个数字将是:
// 0, 1, 2, 3, 4, 5, 6, 7, 8, 9,10,11
0, 1, 1, 2, 1, 2, 2, 3, 1, 2, 2, 3
如您所见,这些是为表中的每个索引设置的位数。
算法的其余部分是您将数字分成8位块并将每个块中设置的位数相加,这就是这些线的含义(您可以根据自己的喜好使用选项1或选项2,不是两个):
// Option 1:
c = BitsSetTable256[v & 0xff] +
BitsSetTable256[(v >> 8) & 0xff] +
BitsSetTable256[(v >> 16) & 0xff] +
BitsSetTable256[v >> 24];
// Option 2:
unsigned char * p = (unsigned char *) &v;
c = BitsSetTable256[p[0]] +
BitsSetTable256[p[1]] +
BitsSetTable256[p[2]] +
BitsSetTable256[p[3]];
底部的代码:
// To initially generate the table algorithmically:
BitsSetTable256[0] = 0;
for (int i = 0; i < 256; i++)
{
BitsSetTable256[i] = (i & 1) + BitsSetTable256[i / 2];
}
是生成BitsSetTable256的另一种方法。它在运行时而不是在编译时生成表(这是宏定义的作用。
P.S。如果你的目标是足够的(SSE4)x86,你可以使用POPCNT指令。