我正在尝试使用英特尔顾问来了解我的应用程序中的热点。
这些是我正在使用的编译和链接器标志:
INTEL_OPT=-O3 -simd -xCORE-AVX2 -parallel -ipo -qopenmp -fargument-noalias -ansi-alias -no-prec-div -fp-model fast=2
INTEL_PROFILE=-g -qopt-report=5 -Bdynamic -shared-intel -debug inline-debug-info -qopenmp-link dynamic -parallel-source-info=2 -ldl
这是从this教程中获取的示例图片:
这是我的应用程序的截图:
我不明白_clone
,[stack]
,_start
和_libc_start_main
之前所有这些功能是什么。
答案 0 :(得分:1)
James是正确的:_clone,[stack],_start和_libc_start_main等对应于CRT,Cray sys libs(如果你使用Cray env),OMP运行时内部或一般系统调用。
同样在您的个人资料中,您似乎没有启用任何矢量化信息(空"为什么没有矢量化",没有剥离 - 剩余分解,没有SIMD效率指标等等)。由于您的编译标志似乎是合理的,我的下一个猜测是您要么将调试信息剥离到单独的文件中,要么使用相当旧的ICL版本。删除ipo也可能有助于启用错过的信息。