如何执行字节的循环旋转?

时间:2013-10-06 02:19:43

标签: c bitmask

我正在尝试实现一个向左和向右执行字节循环旋转的函数。

我为这两个操作编写了相同的代码。例如,如果您向左旋转1010变为0101。这是正确的吗?

unsigned char rotl(unsigned char c) {
    int w;
    unsigned char s = c;
    for (w = 7; w >= 0; w--) {
       int b = (int)getBit(c, w);//
       if (b == 0) {
           s = clearBit(s, 7 - w);
       } else if (b == 1) {
           s = setBit(s, 7 - w);
       }
    }
    return s;
}

unsigned char getBit(unsigned char c, int n) {
    return c = (c & (1 << n)) >> n;
}

unsigned char setBit(unsigned char c, int n) {
    return c = c | (1 << n);
}

unsigned char clearBit(unsigned char c, int n) {
    return c = c &(~(1 << n));
}

3 个答案:

答案 0 :(得分:13)

C中没有旋转运算符,但如果你写:

unsigned char rotl(unsigned char c)
{
    return (c << 1) | (c >> 7);
}

然后,根据这个:http://www.linux-kongress.org/2009/slides/compiler_survey_felix_von_leitner.pdf(第56页),编译器将找出你想要做什么,并在一条(非常快)的指令中执行旋转。

答案 1 :(得分:9)

到目前为止,阅读答案和评论,似乎对你要完成的事情存在一些困惑 - 这可能是因为你使用的词语。在位操作中,您可以执行几项“标准”操作。我将总结其中一些以帮助澄清不同的概念。 在接下来的所有内容中,我将使用abcdefgh来表示8位(可能是1或0) - 当它们四处移动时,相同的字母将引用相同的位(可能在不同的立场);如果有点变成“绝对01,我会将其表示为”。

1)位移:这实际上是“快速乘法或除以2的幂”。使用的符号是<<表示“左移”(乘)或>>表示右移(除)。因此

abcdefgh >> 2 = 00abcdef

(相当于“除以4”)和

abcdefgh << 3 = abcdefgh000 

(相当于“乘以8” - 假设有“空格”将abc移入;否则可能导致溢出)

2)位屏蔽:有时您希望将某些位设置为零。你可以通过一个带有数字的AND运算来实现这一点,该数字具有你想保留一点的数字,并且你想要清除一点就是零。

abcdefgh & 01011010 = 0b0de0g0

或者,如果要确保某些位是1,则使用OR运算:

abcdefgh | 01011010 = a1c11f1h

3)循环移位:这有点棘手 - 有些情况下你想“移动位置”,那些“一端掉落”的东西重新出现在另一端。在C中没有这个符号,也没有“快速指令”(尽管大多数处理器都有内置指令,汇编代码可以利用这些指令进行FFT计算等)。如果你想通过三个位置进行“左循环移位”:

circshift(abcdefgh, 3) = defghabc

(注意:标准C库中没有circshift函数,尽管它存在于其他语言中 - 例如Matlab)。出于同样的原因,“右移”将是

circshift(abcdefgh, -2) = ghabcdef

4)位反转:有时您需要反转数字中的位。反转位时,没有“左”或“右” - 反转相反:

reverse(abcdefgh) = hgfedcba

同样,标准C库中实际上没有“反向”功能。

现在,让我们看一下在C中实现这两个最后两个函数(circshiftreverse)的一些技巧。整个网站都致力于“巧妙地操作位” - 请参阅例如this excellent one。对于一些精彩的“黑客攻击”集合,虽然其中一些可能有点先进......

unsigned char circshift(unsigned char x, int n) {
  return (x << n) | (x >> (8 - n));
}

这使用了上面的两个技巧:移位,并使用OR操作将位设置为特定值。让我们来看看它是如何工作的,因为n = 3(注意 - 我忽略了第8位以上的位,因为函数的返回类型是unsigned char):

(abcdefgh << 3)       = defgh000
(abcdefgh >> (8 - 3)) = 00000abc

取这两个的按位OR给出

defgh000 | 00000abc = defghabc

这正是我们想要的结果。另请注意,a << na >> (-n)相同;换句话说,右移一个负数与左移一个正数相反,反之亦然

现在让我们看一下reverse函数。这样做有“快速方式”和“慢速方式”。上面的代码给出了“非常慢”的方式 - 假设您的编译器允许使用64位(long long)整数,让我向您展示一种“非常快”的方式。

unsigned char reverse(unsigned char b) {
  return (b * 0x0202020202ULL & 0x010884422010ULL) % 1023;
}

你可能会问自己“刚刚发生了什么”?让我告诉你:

b = abcdefgh

* 0x0000000202020202 = 00000000 00000000 0000000a bcdefgha bcdefgha bcdefgha bcdefgha bcdefgh0
& 0x0000010884422010 = 00000000 00000000 00000001 00001000 10000100 01000010 00100000 00010000
                     = 00000000 00000000 0000000a 0000f000 b0000g00 0c0000h0 00d00000 000e0000

请注意,我们现在只有一次所有位 - 它们只是一个相当奇怪的模式。模1023分裂“折叠”了彼此之间的感兴趣的位 - 它就像魔术一样,我无法解释它。结果确实是

hgfedcba

一种稍微不那么模糊的方法来实现同样的事情(效率较低,但效率较高的数字非常有效)识别出如果你交换相邻的位,然后相邻的位对,然后相邻的半字节(4位组)等 - 你最后完成一点反转。在这种情况下,字节反转变为

unsigned char bytereverse(unsigned char b) {
  b = (b & 0x55) << 1 | (b & 0xAA) >> 1; // swap adjacent bits
  b = (b & 0x33) << 2 | (b & 0xCC) >> 2; // swap adjacent pairs
  b = (b & 0x0F) << 4 | (b & 0xF0) >> 4; // swap nibbles
  return b;
}

在这种情况下,字节b = abcdefgh发生以下情况:

b & 0x55 = abcdefgh & 01010101 = 0b0d0f0h << 1 = b0d0f0h0
b & 0xAA = abcdefgh & 10101010 = a0c0e0g0 >> 1 = 0a0c0e0g
OR these two to get badcfehg

下一行:

b & 0x33 = badcfehg & 00110011 = 00dc00hg << 2 = dc00hg00
b & 0xCC = badcfehg & 11001100 = ba00fe00 >> 2 = 00ba00fe
OR these to get dcbahgfe

最后一行:

b & 0x0F = dcbahgfe & 00001111 = 0000hgfe << 4 = hgfe0000
b & 0xF0 = dcbahgfe & 11110000 = dcba0000 >> 4 = 0000dcba
OR these to get hgfedcba

你所追求的是反向字节。应该很容易看出只有几行(类似于上面的)会让你得到一个反向整数(32位)。随着数量的增加,这种技巧相对而言变得越来越有效。

我相信你所寻找的答案在上面的“某个地方”。如果没有别的,我希望你能更清楚地了解C中位操作的可能性。

答案 2 :(得分:1)

如果根据你的意见,你想要完全转移一点,那么一个简单的方法就是:

unsigned char rotl(unsigned char c)
{
    return((c << 1) | (c >> 7));
}

你的代码所做的就是颠倒这些位;不要旋转它们。例如,它将10111001变为10011101,而不是01110011。