使用sbatch SLURM时,为什么要继续使用NonZeroExitCode?

时间:2015-01-22 16:29:45

标签: linux slurm sbatch

我有一个简单的test.ksh,我正在运行命令:

sbatch test.ksh

我一直在" JobState = FAILED Reason = NonZeroExitCode" (使用" scontrol show job")

我已经确定了以下内容:

  1. slurmd和slurmctld启动并正常运行
  2. " test.ksh"的用户权限是777.
  3. 命令" srun test.ksh" (单独使用,不使用sbatch)成功没有问题
  4. 我尝试输入"返回0"在" test.ksh"的最后一行没有运气
  5. 我尝试输入"退出0"在" test.ksh"的最后一行没有运气
  6. 我尝试输入"主机名"在" test.ksh"的最后一行没有运气
  7. 我尝试输入" srun hostname"在" test.ksh"的最后一行没有运气

1 个答案:

答案 0 :(得分:3)

我发现我没有设置--error和--output,这意味着默认是我发出命令的当前目录。

问题是我没有足够的权限写入当前目录。

解决方案是将--error和--output目录设置为我有权限的地方。