标签: visual-studio avx2
当我使用Visual Studio通过编译器instrinsic生成AVX2收集指令时,它不会插入VXORPS指令来打破写入YMM寄存器的先前指令与聚集之间的依赖关系。
然而,英特尔编译器会这样做,最终结果是由于数据依赖性被破坏而导致性能显着提升。
由于我不想进入的原因,我无法使用英特尔编译器,所以有什么方法可以强制使用#34; Visual Studio插入那个VXORPS指令?
我已经尝试创建一个中间件__m256i并在其上调用VXORPS,但这不起作用。