如何检查SLURM批处理作业中仍在运行哪些任务?

时间:2019-10-28 12:49:07

标签: slurm

在SLURM中安排批处理作业时,例如

sbatch -N 10 batch-script.sh
#!/bin/bash
#SBATCH --job-name=jobname

srun --label /usr/bin/hostname

可以用sacct检查当前正在执行哪个步骤:

       JobID    JobName  Partition    Account  AllocCPUS      State ExitCode
------------ ---------- ---------- ---------- ---------- ---------- --------
...
421.1        hostname                  test         10    RUNNING      0:0

但是如何检查当前步骤中哪些任务/节点仍在运行,哪些已完成? (在这种情况下,每个节点只有一个任务。)我在文档中找到的唯一选项是设置一个--task-epilog命令并在完成每个任务时记录一些内容。

例如,很高兴看到10个节点中有8个已完成任务,而node03node08仍在运行。

1 个答案:

答案 0 :(得分:1)

您可以使用squeue命令查看哪些节点处于活动状态。要仅过滤您的工作,您可以执行squeue -u [yourname]。要始终保持更新,您可以执行watch -n 1 "squeue -u [yourname]"