标签: gcc sse intrinsics
我刚刚发现,就像我几个月前写的一些代码一样,我使用诸如:p的混合类型进行了乘法和加法运算。
__m128 = float + __m128 * (__m128 - float)
但是,无论是GCC8还是LLVM6都没有抱怨过,并且输出看起来像预期的那样。
用应该去的浮点数(_mm_set1_ps(float)代替浮点数似乎较慢计算(在循环中,每次迭代都设置浮点数)。
_mm_set1_ps(float)
那是怎么回事?第一个版本安全(便携式/兼容)吗? (此代码已经生产了几个月,没有人抱怨)。