标签: unix time parallel-processing fortran gprof
我对以下问题感到困惑:
我正在尝试检查内部并行Fortran代码的弱缩放。最初我尝试使用time命令,但是我会比real次获得更高的sys+user次。所以,我最终使用gprof来执行时间测量(虽然它可能会减慢执行速度)。
real
sys+user
gprof是一种有效的并行效率基准测试方法(考虑到它不是理想的方法)吗?