标签: gcc optimization compilation
当我使用-O3编译某些循环时,我得到了大量代码,有时会看到非常复杂的长序列SIMD代码。 (显然我需要描述,但由于严重的疾病,我现在无法使用必要的工具。)我的问题:
-O3
我看到我应该能够保留-O3,但有选择地淘汰某些有问题的选项?使用-fno-foo
-fno-foo
我应该首先仔细检查哪些个别选项?潜在的罪魁祸首可能不仅是巨大的代码膨胀(因此指令或微操作高速缓存大小问题),而且由于产生了大量的微操作而导致真正的负性能增益?