Slurm's documentation将MaxRss定义为:
作业中所有任务的最大居民集大小
尽管如此,我已经执行了一系列基准测试来评估该记录的准确性,并且发现Slurm的日志与操作系统中进程注册的内存之间存在严重差异(/proc/meminfo
) 。
实验涉及1个步骤的工作,并且记录的差异大约为10E8。
由于这个原因,并且由于文档的描述性不足,我想知道Slurm如何计算作业的内存。
答案 0 :(得分:2)
我相信会计来自 /proc/
统计数据似乎采用常驻内存大小并减去共享内存。失败可能来自解析、减法或其他问题。我注意到了一些差异,但如果你能展示一个可重现的案例,你应该在 GitHub 上提交一个问题。