运行SLURM命令“squeue”时提到的这个“AssocGrpNodeLimit”是什么?

时间:2016-01-26 05:50:48

标签: slurm

什么是AssocGrpNodeLimitsqueue命令显示它列为我的工作尚未运行的“原因”。我很惊讶,因为有些节点是空闲的。我的首要任务是我见过的最高点(2126)。我用谷歌搜索并将其绑定,我发现它是slurm_protocol_defs.c中的返回值:

/* Given a job's reason for waiting, return a descriptive string */
extern char *job_reason_string(enum job_state_reason inx)
{

...

case WAIT_ASSOC_GRP_NODE:
        return "AssocGrpNodeLimit";

基于包含“AssocGrpNodeLimit”的单词和单词片段,我猜测与我同一组关联的人使用了太多节点,所以我的作业不会运行?

1 个答案:

答案 0 :(得分:3)

AssocGrpNodeLimit是为提交作业的关联设置的节点数限制。

您可以使用squeue -A <account_name>查看限制,如果不受管理员限制,您还可以使用 $('.list').on("click", ".remove", function () { $(this).parent().remove(); });

列出特定帐户的作业

来自http://slurm.schedmd.com/sacctmgr.html的术语关联的定义(原文强调):

  

基于形成所谓的关联的四个参数记录Slurm帐户信息。这些参数是   用户群集分区帐户 user 是登录名。   是 ClusterName 指定的Slurm托管集群的名称    slurm.conf 配置文件中的参数。 partition 是名称   该群集上的Slurm分区。 帐户是银行帐户   一份工作。