标签: slurm
当我在slurm中使用“sinfo”时,我会在其中一个分区附近看到一个星号(如:RUNNING-CLUSTER *)。
分区看起来很好,其下的所有节点都处于空闲状态。
例如,当我运行一个带有“sleep 300”的简单脚本时,我可以看到队列中的作业(使用“squeue”),但它们会运行几秒钟并结束。没有错误消息(我可以在日志中看到他们失败了。没有更多信息)。
知道星号的用途是什么吗? 无法在手册中找到它。
感谢。
答案 0 :(得分:1)
分区名称后面的“*”表示这是已提交作业的默认分区。 LLNL提供直接支持我的发现的文档:
LLNL Documentation