应用错误收集

您有一个带AVX的处理器。它没有XMM寄存器只有YMM寄存器。如果您使用AVX支持编译所有代码（例如在GCC中使用-mavx或在MSVC中使用/ arch：AVX），则所有SSE2代码都在YMM寄存器的低128位上运行。没有什么可担心的。

但是，假设您有两个不同的模块，您使用SSE2支持编译（例如在GCC中使用-msse2或在MSVC中使用/ arch：SSE2），另一个使用AVX支持并且您使用两者中的函数然后您确实拥有某些模块担心何时在它们之间切换。在这种情况下，当您从AVX切换到SSE2代码时，应该调用_mm256_zeroupper() or _mm256_zeroall()，除非您想要降低性能。 Using AVX CPU instructions: Poor performance without "/arch:AVX"

简单的解决方案是使用AVX支持编译所有代码。我可以想到编译具有不同指令集支持的不同模块的唯一原因是，如果您想创建一个CPU调度程序，那么您的代码可以在不同的处理器上运行。实施起来有点痛苦。但是你不进行状态更改所以我只能想到你需要担心状态改变就是从共享库中调用函数时，这些函数是用另一个指令集编译的（例如用SSE2编译的DLL）。在这种情况下，您可能需要在从AVX代码调用库函数时调用_mm256_zeroupper() or _mm256_zeroall()。

在AVX内在函数中使用xmm参数

1 个答案: