Question

根据我对strict aliasing rule的理解，fast inverse square root的此代码将导致C ++中的未定义行为：

float Q_rsqrt( float number )
{
    long i;
    float x2, y;
    const float threehalfs = 1.5F;

    x2 = number * 0.5F;
    y  = number;
    i  = * ( long * ) &y; // type punning
    i  = 0x5f3759df - ( i >> 1 );
    y  = * ( float * ) &i;
    y  = y * ( threehalfs - ( x2 * y * y ) );

    return y;
}

这段代码确实会导致UB吗？如果是，如何以符合标准的方式重新实现？如果没有，为什么不呢？

假设：在调用此函数之前，我们已经以某种方式检查了浮点数是IEEE 754 32位格式sizeof(long)==sizeof(float)，平台是小端。

Answer 1

符合标准的方式是std::memcpy。这应该在您指定的假设下符合标准。如果可能的话，任何合理的编译器都会把它变成一堆寄存器移动。此外，我们还可以使用C ++ 11的static_assert和来自<cstdint>的固定宽度整数类型来缓解（或至少检查）您做出的一些假设。无论如何，Endianness是无关紧要的，因为我们不在这里处理任何数组，如果整数类型是little-endian，浮点类型也是。

float Q_rsqrt( float number ) { static_assert(std::numeric_limits<float>::is_iec559, "fast inverse square root requires IEEE-comliant 'float'"); static_assert(sizeof(float)==sizeof(std::uint32_t), "fast inverse square root requires 'float' to be 32-bit"); float x2 = number * 0.5F, y = number; std::uint32_t i; std::memcpy(&i, &y, sizeof(float)); i = 0x5f3759df - ( i >> 1 ); std::memcpy(&y, &i, sizeof(float)); return y * ( 1.5F - ( x2 * y * y ) ); }

Answer 2

您应该使用memcpy。 AFAIK这是唯一符合标准的方式，编译器足够聪明，可以用单个单词移动指令替换调用。有关这些说法背后的原因，请参阅this question。

Answer 3

我不认为你可以在没有UB的情况下在严格的标准意义上做到这一点，仅仅因为它依赖于诸如float和long的特定值表示之类的东西。该标准没有具体说明这些（故意），并且给予实施在这方面做他们认为合适的自由，特别是应用＆＃34; UB＆＃34;标记所有依赖于此类事物的行为。

这并不意味着这将是＆＃34; Heisenbug＆＃34;或者＆＃34;鼻子恶魔＆＃34; UB的类型;最有可能的是，实现将提供此行为的定义。只要这些定义满足代码的前提条件，它就没问题。这里的先决条件是：

实施允许类型惩罚。
sizeof(float) == sizeof(long)。
float的内部表示是这样的：如果这些位被解释为long，则0x5f3759df和>> 1具有该hack运行所需的含义。< / LI>

但是，不可能以完全可移植的方式重写（即没有UB） - 例如，对于使用不同浮点运算实现的平台，您会怎么做？只要您依赖特定平台的具体细节，您就依赖于标准中未定义但由平台定义的行为。

Answer 4

不。该算法首先假设IEEE754布局，这不是符合标准的有效假设。对于任何其他布局，特定常量0x5f3759df将完全错误。甚至假设存在这样的常数也是有缺陷的。例如，我认为一旦你颠倒了浮动内部字段的顺序，它就会中断。

即使假设IEEE754，我也不确定Q_rsqrt(-0.0f)是否正常工作。两个零（正数和负数）应该相等，sqrt(x)仅为x<-0.0f

未定义

如何实现没有未定义行为的快速逆sqrt？

4 个答案: