我在四节点集群中构建了SGE以获取源代码。 Centos7中的操作系统。当我在集群中提交一些简单的任务时,我发现在一个节点中只运行了一个任务。有什么问题?这是我的任务代码:
sleep 60
echo "done"
这是我提交任务的cmd:
DIR=`pwd`
option=""
for((i=0;i<5;i++));do
qsub -q multislots $option -V -cwd -o stdout -e stderr -S /bin/bash $DIR/test.sh
sleep 1
done
运行qstat -f时,显示:enter image description here
答案 0 :(得分:0)
鉴于有关作业失败的错误消息,因为:“找不到未使用的add_grp_id”。您应该检查sge配置中的gid_range设置(全局以及每个主机是否有一个)。它应该是一系列未使用的组ID。至少与您希望节点上的作业一样多的gid。
如果不是这样,请尝试在其中一个排队作业上运行qalter -w v和qalter -w p,以了解它们未启动的原因。