AVX2收集指令

时间:2015-10-23 19:09:52

标签: visual-studio avx2

当我使用Visual Studio通过编译器instrinsic生成AVX2收集指令时,它不会插入VXORPS指令来打破写入YMM寄存器的先前指令与聚集之间的依赖关系。

然而,英特尔编译器会这样做,最终结果是由于数据依赖性被破坏而导致性能显着提升。

由于我不想进入的原因,我无法使用英特尔编译器,所以有什么方法可以强制使用#34; Visual Studio插入那个VXORPS指令?

我已经尝试创建一个中间件__m256i并在其上调用VXORPS,但这不起作用。

0 个答案:

没有答案