重启Linux工作站时与日志文件相关的pbs_mom问题

时间:2015-08-25 19:28:00

标签: linux pbs torque

启动我们的某个工作站时遇到一些问题,我认为它与TORQUE资源管理器有关。

(扭矩服务器在CentOS上运行,RedHat上的工作站)

我需要道歉,我可能无法更准确地解释问题,但我目前缺乏进一步缩小范围的知识和技能。简要介绍一下这个问题的背景:我们最近在周末停电的时间超过备用电池的持续时间。因此,基本上每个工作站以及NIS主站和从站都被关闭。不幸的是,我们的系统管理员上个月离开了,我只是想让机器恢复运行。由于

,只剩下一个工作站无法启动

pbs_mom: LOG_ERROR::read_config, config[19] special command log_file_role_depth failed with = 5

我在网上搜索解决方案并尝试了不同的方法:

  • 在扭矩服务器上重新启动pbs_mom
  • 清除日志文件
  • 修复扭矩相关目录中的权限

但是,我想知道log_file_role_depth=5文件本身中的mom_priv/config设置。看起来它不是一个有效的命令?!我尝试将其更改为...=1并将其完全评论出来,但是,在此之后机器会在重新启动时遇到问题,我无法判断哪一台导致此问题:

enter image description here

(上面的截图来自工作站,而不是扭矩服务器)

扭矩服务器上似乎也存在相关问题。例如,如果我终止pbs_mom进程并通过

重新启动它
pbs_mom -p

我得到了相同的日志文件错误,但之后运行了pbs_mom进程。

enter image description here

任何想法或建议接下来要尝试什么?我非常感谢任何反馈,由于我缺乏系统管理员的技能,我真的有点失落。

1 个答案:

答案 0 :(得分:0)

此消息表示处理妈妈的配置文件时出错。它位于/ mom_priv / config中。默认情况下,这是/ var / spool / torque / mom_priv / config。从错误消息中,您的文件看起来像:

$log_file_roll_depth = 5

你想要它没有等号:

$log_file_roll_depth 5