我正在尝试实现一个向左和向右执行字节循环旋转的函数。
我为这两个操作编写了相同的代码。例如,如果您向左旋转1010
变为0101
。这是正确的吗?
unsigned char rotl(unsigned char c) {
int w;
unsigned char s = c;
for (w = 7; w >= 0; w--) {
int b = (int)getBit(c, w);//
if (b == 0) {
s = clearBit(s, 7 - w);
} else if (b == 1) {
s = setBit(s, 7 - w);
}
}
return s;
}
unsigned char getBit(unsigned char c, int n) {
return c = (c & (1 << n)) >> n;
}
unsigned char setBit(unsigned char c, int n) {
return c = c | (1 << n);
}
unsigned char clearBit(unsigned char c, int n) {
return c = c &(~(1 << n));
}
答案 0 :(得分:13)
C中没有旋转运算符,但如果你写:
unsigned char rotl(unsigned char c)
{
return (c << 1) | (c >> 7);
}
然后,根据这个:http://www.linux-kongress.org/2009/slides/compiler_survey_felix_von_leitner.pdf(第56页),编译器将找出你想要做什么,并在一条(非常快)的指令中执行旋转。
答案 1 :(得分:9)
到目前为止,阅读答案和评论,似乎对你要完成的事情存在一些困惑 - 这可能是因为你使用的词语。在位操作中,您可以执行几项“标准”操作。我将总结其中一些以帮助澄清不同的概念。 在接下来的所有内容中,我将使用abcdefgh
来表示8位(可能是1或0) - 当它们四处移动时,相同的字母将引用相同的位(可能在不同的立场);如果有点变成“绝对0
或1
,我会将其表示为”。
1)位移:这实际上是“快速乘法或除以2的幂”。使用的符号是<<
表示“左移”(乘)或>>
表示右移(除)。因此
abcdefgh >> 2 = 00abcdef
(相当于“除以4”)和
abcdefgh << 3 = abcdefgh000
(相当于“乘以8” - 假设有“空格”将abc
移入;否则可能导致溢出)
2)位屏蔽:有时您希望将某些位设置为零。你可以通过一个带有数字的AND运算来实现这一点,该数字具有你想保留一点的数字,并且你想要清除一点就是零。
abcdefgh & 01011010 = 0b0de0g0
或者,如果要确保某些位是1,则使用OR运算:
abcdefgh | 01011010 = a1c11f1h
3)循环移位:这有点棘手 - 有些情况下你想“移动位置”,那些“一端掉落”的东西重新出现在另一端。在C中没有这个符号,也没有“快速指令”(尽管大多数处理器都有内置指令,汇编代码可以利用这些指令进行FFT计算等)。如果你想通过三个位置进行“左循环移位”:
circshift(abcdefgh, 3) = defghabc
(注意:标准C库中没有circshift
函数,尽管它存在于其他语言中 - 例如Matlab)。出于同样的原因,“右移”将是
circshift(abcdefgh, -2) = ghabcdef
4)位反转:有时您需要反转数字中的位。反转位时,没有“左”或“右” - 反转相反:
reverse(abcdefgh) = hgfedcba
同样,标准C库中实际上没有“反向”功能。
现在,让我们看一下在C中实现这两个最后两个函数(circshift
和reverse
)的一些技巧。整个网站都致力于“巧妙地操作位” - 请参阅例如this excellent one。对于一些精彩的“黑客攻击”集合,虽然其中一些可能有点先进......
unsigned char circshift(unsigned char x, int n) {
return (x << n) | (x >> (8 - n));
}
这使用了上面的两个技巧:移位,并使用OR操作将位设置为特定值。让我们来看看它是如何工作的,因为n = 3(注意 - 我忽略了第8位以上的位,因为函数的返回类型是unsigned char
):
(abcdefgh << 3) = defgh000
(abcdefgh >> (8 - 3)) = 00000abc
取这两个的按位OR给出
defgh000 | 00000abc = defghabc
这正是我们想要的结果。另请注意,a << n
与a >> (-n)
相同;换句话说,右移一个负数与左移一个正数相反,反之亦然。
现在让我们看一下reverse
函数。这样做有“快速方式”和“慢速方式”。上面的代码给出了“非常慢”的方式 - 假设您的编译器允许使用64位(long long
)整数,让我向您展示一种“非常快”的方式。
unsigned char reverse(unsigned char b) {
return (b * 0x0202020202ULL & 0x010884422010ULL) % 1023;
}
你可能会问自己“刚刚发生了什么”?让我告诉你:
b = abcdefgh
* 0x0000000202020202 = 00000000 00000000 0000000a bcdefgha bcdefgha bcdefgha bcdefgha bcdefgh0
& 0x0000010884422010 = 00000000 00000000 00000001 00001000 10000100 01000010 00100000 00010000
= 00000000 00000000 0000000a 0000f000 b0000g00 0c0000h0 00d00000 000e0000
请注意,我们现在只有一次所有位 - 它们只是一个相当奇怪的模式。模1023分裂“折叠”了彼此之间的感兴趣的位 - 它就像魔术一样,我无法解释它。结果确实是
hgfedcba
一种稍微不那么模糊的方法来实现同样的事情(效率较低,但效率较高的数字非常有效)识别出如果你交换相邻的位,然后相邻的位对,然后相邻的半字节(4位组)等 - 你最后完成一点反转。在这种情况下,字节反转变为
unsigned char bytereverse(unsigned char b) {
b = (b & 0x55) << 1 | (b & 0xAA) >> 1; // swap adjacent bits
b = (b & 0x33) << 2 | (b & 0xCC) >> 2; // swap adjacent pairs
b = (b & 0x0F) << 4 | (b & 0xF0) >> 4; // swap nibbles
return b;
}
在这种情况下,字节b = abcdefgh
发生以下情况:
b & 0x55 = abcdefgh & 01010101 = 0b0d0f0h << 1 = b0d0f0h0
b & 0xAA = abcdefgh & 10101010 = a0c0e0g0 >> 1 = 0a0c0e0g
OR these two to get badcfehg
下一行:
b & 0x33 = badcfehg & 00110011 = 00dc00hg << 2 = dc00hg00
b & 0xCC = badcfehg & 11001100 = ba00fe00 >> 2 = 00ba00fe
OR these to get dcbahgfe
最后一行:
b & 0x0F = dcbahgfe & 00001111 = 0000hgfe << 4 = hgfe0000
b & 0xF0 = dcbahgfe & 11110000 = dcba0000 >> 4 = 0000dcba
OR these to get hgfedcba
你所追求的是反向字节。应该很容易看出只有几行(类似于上面的)会让你得到一个反向整数(32位)。随着数量的增加,这种技巧相对而言变得越来越有效。
我相信你所寻找的答案在上面的“某个地方”。如果没有别的,我希望你能更清楚地了解C中位操作的可能性。
答案 2 :(得分:1)
如果根据你的意见,你想要完全转移一点,那么一个简单的方法就是:
unsigned char rotl(unsigned char c)
{
return((c << 1) | (c >> 7));
}
你的代码所做的就是颠倒这些位;不要旋转它们。例如,它将10111001变为10011101,而不是01110011。