我为Slurm编写了一个省电插件,以便我可以将Slurm与云提供商一起使用。
我分配可以同时运行多个作业的节点。让我们说我可以运行10个作业/节点。
目前,如果我请求某个作业,它会启动一个节点(创建一个云VM)。如果我立即请求第二个工作,Slurm将启动第二个节点。
如果当前正在启动的第一个节点也无法处理新作业,我希望Slurm仅启动第二个节点。否则,也将新作业分配给当前正在启动的节点。
这可以通过配置吗?
非常感谢!
答案 0 :(得分:0)
是的,是可能的。您只需使用SelectType=select/cons_res
并指定节点在其配置中的核心数量 - 由于云节点的性质,slurmctl将启动而无法检查节点上的核心数。在每个核心资源跟踪的情况下,slurmctl在启动时分配核心位图,因此必须在slurm.conf
中指定核心数。它在elastic computing for slurm page