当我通过SBATCH
作业提交给HPC
时,我相信slurm会根据资源分配节点,在我的情况下,主机总是在节点0 上生成在node/machine
名称的字母顺序中设置为第一。这引起了问题,因为(有时)此主机节点可能仅运行1个核心,(因此内存量很小),这意味着它无法写入我需要的大结果/数据文件。
鉴于slurm在我的nodefile
中分配的资源,有什么方法可以手动设置主机节点吗?
我可以使用-mincpus
来解决此问题,但我仅需要> 1 cpu即可实现这一目的。其他增加--mem-per-cpu
或仅增加--mem
的解决方案也只会增加工作资源,并延迟启动。
答案 0 :(得分:0)
您可以使用--nodelist
参数设置应使用的特定节点:
sbatch --nodelist=<NODE-NAME> script.sh
甚至--exclude
您不想使用的对象(例如节点0):
sbatch --exclude=node0 script.sh
official documentation提供了关于这两个选项的更多信息。