标签: parallel-processing slurm
我对SLURM还不熟悉:我使用的网格有很多不同的用户,当他们提交或取消作业时,似乎其他用户无法查询分区状态等。这非常令人沮丧,特别是在创建作业时因为控制器很忙而导致其他作业失败。有没有人知道解决方法?
答案 0 :(得分:1)
使用默认设置,当许多用户同时提交/修改/取消许多作业时,Slurm可能会变慢/挂起,尤其是启用了回填和记帐。
请参阅2012年Slurm用户组会议的these slides中有关改进的提示。