我需要测量在群集上运行的串行代码的挂起时间。在独占模式中,即没有其他用户正在使用我的节点,代码的挂起时间变化很大,范围从2:30到3:20m。代码在每次运行中都做同样的事情。如果由于代码读取和写入存储在GPFS文件系统中的文件而导致GPFS文件系统导致墙上时间的巨大变化,我就会徘徊。我的问题是,是否有工具我可以查看GPFS i / o性能并将其与我的代码性能联系起来?
感谢。
答案 0 :(得分:0)
这是一个非常大的问题......我们需要缩小范围。所以,让我问一些问题。
让我们看一下简单的ls命令的time命令输出。
$ time ls 真正的0m0.003s 用户0m0.001s sys 0m0.001s
挂钟时间是==实时,在您的情况下,是变化的。如果我们进入下一步调试,问题是:用户时间和系统时间是否也有所不同?如果GPFS文件系统在内核中并消耗不同的时间,您应该看到sys时间变化。如果系统时间保持不变,但实际时间不同,则程序会花时间睡在某些东西上。有更深层次的方法可以找到问题....但是,您能否请更多地澄清您的问题?