我一直在寻找如何将BSWAP用于64位寄存器的低32位子寄存器的答案。例如,0x0123456789abcdef
在RAX寄存器中,我想用一条指令将其更改为0x01234567efcdab89
(因为性能)。
所以我尝试了内联函数:
#define BSWAP(T) { \
__asm__ __volatile__ ( \
"bswap %k0" \
: "=q" (T) \
: "q" (T)); \
}
结果是0x00000000efcdab89
。我不明白为什么编译器就像这样。有人知道有效的解决方案吗?
答案 0 :(得分:5)
啊,是的,我现在明白了这个问题:
x86-64处理器 implicitly zero-extend 32位寄存器在执行32位操作时为64位(在%eax,%ebx等上)。这是为了保持与遗留代码的兼容性,遗留代码需要这些寄存器的32位语义,据我所知。
所以我担心在64位寄存器的低32位上有无法来执行ror
。你必须使用一系列的几个指令...
答案 1 :(得分:-1)
检查gcc生成的汇编输出!使用gcc -s
标志编译代码并生成asm输出。
IIRC,x86-64在没有明确指示的情况下默认使用32位整数,因此这可能是(部分)问题。