我可以看到gcc的PGO(配置文件引导优化)在我的应用程序中运行良好(执行速度提高了约15%)。我正在使用'-fprofile-generate'然后'-fprofile-use'。但有没有办法生成一些报告描述什么以及如何优化?我知道英特尔编译器(icc)可以做到这一点,但gcc怎么样?
答案 0 :(得分:2)
有-fdump-ipa-all
或-fdump-ipa-cgraph
这些不会产生漂亮的报告,但它可能是您在gcc中找到的优化报告中最接近的内容。此外,一些优化选项具有详细输出,可以准确地告诉您优化的内容,例如-ftree-vectorizer-verbose=n
。您可以查看更多详细信息here。
答案 1 :(得分:0)
一个选择是使用性能并分析缓存命中/未命中更改以及其他事件。虽然这不一定表示已进行了更改,但它概述了可以针对优化进行哪些类型的更改。