JobID JobName MaxRSS Elapsed AveCPU CPUTime SystemCPU
------------ ---------- ---------- ---------- ---------- ---------- ----------
16260894 GP 06:29:33 2-16:55:30 05:49:13
16260894.ba+ batch 3336K 06:29:33 00:00:00 2-16:55:30 00:00.008
16260894.0 gp_wrappe+ 5566876K 06:29:33 3-11:40:54 2-16:55:30 05:49:13
以上是我在slurm集群上运行的作业的sacct
输出。我使用了10个CPU,1个任务和1个节点。我对使用slurm集群仍然不太熟悉,但我认为我理解:CPUTime
表示作业可能花费的最大CPU时间,在这种情况下只是等于n_cpus * Elapsed
。但是,我的想法是AveCPU
是程序中使用的实际cpu时间。
原则上我不仅期望它低于CPUTime
,因为我不能使用比我更多的资源。但是,我希望我的脚本只使用最大处理能力(所有10个核心)只有一小部分时间,因为只有部分处理是完全多线程的。那么AveCPU
如何是3.5天,而CPUTime
是2.7天呢?