根据我对strict aliasing rule的理解,fast inverse square root的此代码将导致C ++中的未定义行为:
float Q_rsqrt( float number )
{
long i;
float x2, y;
const float threehalfs = 1.5F;
x2 = number * 0.5F;
y = number;
i = * ( long * ) &y; // type punning
i = 0x5f3759df - ( i >> 1 );
y = * ( float * ) &i;
y = y * ( threehalfs - ( x2 * y * y ) );
return y;
}
这段代码确实会导致UB吗?如果是,如何以符合标准的方式重新实现?如果没有,为什么不呢?
假设:在调用此函数之前,我们已经以某种方式检查了浮点数是IEEE 754 32位格式sizeof(long)==sizeof(float)
,平台是小端。
答案 0 :(得分:9)
符合标准的方式是std::memcpy
。这应该在您指定的假设下符合标准。如果可能的话,任何合理的编译器都会把它变成一堆寄存器移动。此外,我们还可以使用C ++ 11的static_assert
和来自<cstdint>
的固定宽度整数类型来缓解(或至少检查)您做出的一些假设。无论如何,Endianness是无关紧要的,因为我们不在这里处理任何数组,如果整数类型是little-endian,浮点类型也是。
float Q_rsqrt( float number )
{
static_assert(std::numeric_limits<float>::is_iec559,
"fast inverse square root requires IEEE-comliant 'float'");
static_assert(sizeof(float)==sizeof(std::uint32_t),
"fast inverse square root requires 'float' to be 32-bit");
float x2 = number * 0.5F, y = number;
std::uint32_t i;
std::memcpy(&i, &y, sizeof(float));
i = 0x5f3759df - ( i >> 1 );
std::memcpy(&y, &i, sizeof(float));
return y * ( 1.5F - ( x2 * y * y ) );
}
答案 1 :(得分:6)
您应该使用memcpy
。 AFAIK这是唯一符合标准的方式,编译器足够聪明,可以用单个单词移动指令替换调用。有关这些说法背后的原因,请参阅this question。
答案 2 :(得分:4)
我不认为你可以在没有UB的情况下在严格的标准意义上做到这一点,仅仅因为它依赖于诸如float
和long
的特定值表示之类的东西。该标准没有具体说明这些(故意),并且给予实施在这方面做他们认为合适的自由,特别是应用&#34; UB&#34;标记所有依赖于此类事物的行为。
这并不意味着这将是&#34; Heisenbug&#34;或者&#34;鼻子恶魔&#34; UB的类型;最有可能的是,实现将提供此行为的定义。只要这些定义满足代码的前提条件,它就没问题。这里的先决条件是:
sizeof(float) == sizeof(long)
。float
的内部表示是这样的:如果这些位被解释为long
,则0x5f3759df
和>> 1
具有该hack运行所需的含义。< / LI>
但是,不可能以完全可移植的方式重写(即没有UB) - 例如,对于使用不同浮点运算实现的平台,您会怎么做?只要您依赖特定平台的具体细节,您就依赖于标准中未定义但由平台定义的行为。
答案 3 :(得分:3)
不。该算法首先假设IEEE754布局,这不是符合标准的有效假设。对于任何其他布局,特定常量0x5f3759df
将完全错误。甚至假设存在这样的常数也是有缺陷的。例如,我认为一旦你颠倒了浮动内部字段的顺序,它就会中断。
即使假设IEEE754,我也不确定Q_rsqrt(-0.0f)
是否正常工作。两个零(正数和负数)应该相等,sqrt(x)
仅为x<-0.0f