启动我们的某个工作站时遇到一些问题,我认为它与TORQUE资源管理器有关。
(扭矩服务器在CentOS上运行,RedHat上的工作站)
我需要道歉,我可能无法更准确地解释问题,但我目前缺乏进一步缩小范围的知识和技能。简要介绍一下这个问题的背景:我们最近在周末停电的时间超过备用电池的持续时间。因此,基本上每个工作站以及NIS主站和从站都被关闭。不幸的是,我们的系统管理员上个月离开了,我只是想让机器恢复运行。由于
,只剩下一个工作站无法启动 pbs_mom: LOG_ERROR::read_config, config[19] special command log_file_role_depth failed with = 5
我在网上搜索解决方案并尝试了不同的方法:
但是,我想知道log_file_role_depth=5
文件本身中的mom_priv/config
设置。看起来它不是一个有效的命令?!我尝试将其更改为...=1
并将其完全评论出来,但是,在此之后机器会在重新启动时遇到问题,我无法判断哪一台导致此问题:
(上面的截图来自工作站,而不是扭矩服务器)
扭矩服务器上似乎也存在相关问题。例如,如果我终止pbs_mom
进程并通过
pbs_mom -p
我得到了相同的日志文件错误,但之后运行了pbs_mom进程。
任何想法或建议接下来要尝试什么?我非常感谢任何反馈,由于我缺乏系统管理员的技能,我真的有点失落。
答案 0 :(得分:0)
此消息表示处理妈妈的配置文件时出错。它位于/ mom_priv / config中。默认情况下,这是/ var / spool / torque / mom_priv / config。从错误消息中,您的文件看起来像:
$log_file_roll_depth = 5
你想要它没有等号:
$log_file_roll_depth 5