SLURM-UserCPU输出-如何解释?

时间:2018-10-01 05:59:32

标签: slurm

我正在分析在群集上运行的批处理脚本的CPU使用率。 我使用Sacct和UserCPU来获取相关的输出 输出格式很难关联。我知道是时候了-但我不知道正在使用什么单位。报告使用20个内核的工作的示例是--1206-18:1 +

有人可以帮助我了解我的工作使用了多少cpu吗?是我工作的20个最佳核心,或者我应该分配的更少。

谢谢 阿米特

1 个答案:

答案 0 :(得分:0)

Slurm用于报告UserCPU的格式为[days-]hours:minutes:seconds[.microseconds]。您看到的字符串被截断,因为列宽太小,如字符串末尾的+符号所示。

要查看完整的字符串,请使用%NUMBER格式修饰符增加列宽,例如:

sacct --format jobid,usercpu%20

您的工作似乎已经消耗了1206.75天的CPU,因此在20个内核上运行超过60天。您需要将该数字与挂钟时间(即elapsed列中报告的时间)进行比较。