获取PBS作业队列的描述

时间:2016-03-01 01:18:26

标签: hpc pbs

是否有任何命令可以让我查询正在运行/排队的PBS作业的描述,例如RAM,处理器数量,GPU等属性?

2 个答案:

答案 0 :(得分:3)

使用qstat命令:

qstat -f job_id

答案 1 :(得分:1)

扩展 dimm 发布的答案。

如果作业已在队列中注册,则可以使用qstat命令查询其属性。如果作业已完成,则只能从日志文件中获取相关信息。有一个方便的tracejob命令为你做grepping。

在PBS Pro和Torque中,使用队列注册的每个作业都有两组属性:

  • Resource_List拥有为正在运行或排队的作业请求的资源
  • resources_used保存正在运行的作业的实际资源使用情况。

例如,在PBS Pro中,您可以获得Resource_List

的以下属性
 Resource_List.mem = 2000mb
 Resource_List.mpiprocs = 8
 Resource_List.ncpus = 8
 Resource_List.nodect = 1
 Resource_List.place = free
 Resource_List.qlist = queue1
 Resource_List.select = 1:ncpus=8:mpiprocs=8
 Resource_List.walltime = 02:00:00

以及resources_used

的以下值
 resources_used.cpupercent = 800
 resources_used.cput = 00:03:31
 resources_used.mem = 529992kb
 resources_used.ncpus = 8
 resources_used.vmem = 3075580kb
 resources_used.walltime = 00:00:28

对于已完成的作业tracejob,您只能获取一些所请求的资源:

 ncpus=8:mem=2048000kb

和resources_used的最终值

 resources_used.cpupercent=799
 resources_used.cput=00:54:29
 resources_used.mem=725520kb 
 resources_used.ncpus=8
 resources_used.vmem=3211660kb
 resources_used.walltime=00:06:53