反转16位和32位整数的字节顺序的最快方法是什么。我经常做类似的事情(这个编码是在C ++的Visual Studio中完成的):
union bytes4
{
__int32 value;
char ch[4];
};
union bytes2
{
__int16 value;
char ch[2];
};
__int16 changeEndianness16(__int16 val)
{
bytes2 temp;
temp.value=val;
char x= temp.ch[0];
temp.ch[0]=temp.ch[1];
temp.ch[1]=x;
return temp.value;
}
__int32 changeEndianness32(__int32 val)
{
bytes4 temp;
temp.value=val;
char x;
x= temp.ch[0];
temp.ch[0]=temp.ch[1];
temp.ch[1]=x;
x= temp.ch[2];
temp.ch[2]=temp.ch[3];
temp.ch[3]=x;
return temp.value;
}
有没有更快的方法来做同样的事情,我不需要做那么多计算?
答案 0 :(得分:8)
为什么不使用内置的swab
函数,它可能比您的代码更优化?
除此之外,通常的位移操作应该很快开始,并且如此广泛使用,它们可能被优化器识别并被更好的代码所取代。
因为其他答案都有严重的错误,我会发布一个更好的实现:
int16_t changeEndianness16(int16_t val)
{
return (val << 8) | // left-shift always fills with zeros
((val >> 8) & 0x00ff); // right-shift sign-extends, so force to zero
}
我测试的所有编译器都没有为此代码生成rolw
,我认为稍长的序列(就指令数而言)实际上更快。基准会很有趣。
对于32位,操作有几个可能的订单:
//version 1
int32_t changeEndianness32(int32_t val)
{
return (val << 24) |
((val << 8) & 0x00ff0000) |
((val >> 8) & 0x0000ff00) |
((val >> 24) & 0x000000ff);
}
//version 2, one less OR, but has data dependencies
int32_t changeEndianness32(int32_t val)
{
int32_t tmp = (val << 16) |
((val >> 16) & 0x00ffff);
return ((tmp >> 8) & 0x00ff00ff) | ((tmp & 0x00ff00ff) << 8);
}
答案 1 :(得分:5)
至少在Visual C ++中,您可以使用_byteswap_ulong()和朋友:http://msdn.microsoft.com/en-us/library/a3140177.aspx
这些函数被VC ++编译器视为内在函数,并将生成生成的代码,以便在可用时利用硬件支持。使用VC ++ 10.0 SP1,我看到以下为x86生成的代码:
return _byteswap_ulong(val);
mov eax, DWORD PTR _val$[esp-4]
bswap eax
ret 0
return _byteswap_ushort(val);
mov ax, WORD PTR _val$[esp-4]
mov ch, al
mov cl, ah
mov ax, cx
ret 0
答案 2 :(得分:2)
谁说它做了太多计算?
out = changeEndianness16(in);
gcc 4.6.0
movzwl -4(%rsp), %edx
movl %edx, %eax
movsbl %dh, %ecx
movb %cl, %al
movb %dl, %ah
movw %ax, -2(%rsp)
clang++ 2.9
movw -2(%rsp), %ax
rolw $8, %ax
movw %ax, -4(%rsp)
Intel C/C++ 11.1
movzwl 4(%rsp), %ecx
rolw $8, %cx
xorl %eax, %eax
movw %cx, 6(%rsp)
您的编译器生成什么?
答案 3 :(得分:1)
我使用以下代码进行16位版本交换功能:
_int16 changeEndianness16(__int16 val)
{
return ((val & 0x00ff) << 8) | ((val & 0xff00) >> 8);
}
使用 g ++(Ubuntu / Linaro 4.4.4-14ubuntu5)4.4.5 使用g++ -O3 -S -fomit-frame-pointer test.cpp
编译时的上述代码会产生以下(非内联)汇编代码:
movzwl 4(%esp), %eax
rolw $8, %ax
ret
下一个代码是等效的,但是g ++不如优化它。
__int16 changeEndianness16_2(__int16 val)
{
return ((val & 0xff) << 8) | (val >> 8);
}
编译它会提供更多asm代码:
movzwl 4(%esp), %edx
movl %edx, %eax
sarl $8, %eax
sall $8, %edx
orl %edx, %eax
ret