我们的群集使用SLURM来管理工作负载。我想提取一份报告,报告在给定日期之后完成的所有作业的CPU,RAM和每个帐户的磁盘使用情况。有可能吗?
我一直在关注sreport和sacct,但似乎无法按照我的意愿定制它,我能得到的最好是
sreport job SizesByAccount start=2015-01-01 -t percent Format=account Grouping=5,9
表示CPU使用率。有什么建议吗?
感谢。
答案 0 :(得分:0)
如果将来可以对某人有所帮助,我会使用
$ sacct -S2020-01-01 -E2020-10-07 -X -oJobID,Elapsed,ReqMem,ReqCPUS,User,Node --parsable
69836|00:00:22|3200Mc|1|user1|slurm-node20|
69837|00:03:06|1200Mc|1|user2|slurm-node15|
69838|00:03:08|3200Mc|1|user1|slurm-node12|
69839|00:00:11|1200Mc|1|user1|slurm-node12|
69840|00:03:01|3200Mc|1|user1|slurm-node10|
[...]
然后使用Python解析结果。