分析非常长时间运行的任务

时间:2012-06-21 14:06:57

标签: linux optimization profiling

如何分析产生大量其他进程的长时间运行的脚本?

我们的工作需要很长时间才能运行 - 11个小时或更长时间,有时超过17个小时 - 因此它可以在Amazon EC2实例上运行。

(正在进行袖扣DNA对齐和填充。)

这项工作正在执行许多流程,脚本和实用程序等。

我们如何对其进行分析并确定作业的哪些组成部分花费的时间最长?

每秒每个进程的简单CPU利用率可能就足够了。我们怎样才能获得它?

1 个答案:

答案 0 :(得分:3)

您的问题有很多解决方案:

  • munin是一款出色的监控工具,可以扫描系统中的几乎所有内容并制作出漂亮的图表:)。安装和使用它非常容易。

  • atop可能是一个简单的解决方案,它可以定期扫描cpu,内存,磁盘,你可以将所有这些信息存储到文件中(-W选项),然后你就可以了分析这些文件以发现瓶颈。

  • sar,可以扫描超过系统上的所有内容,但更难以解释(例如,您必须自己使用RRDtool制作图表)