我有一个10节点集群。其中,我正在研究节点(不是主节点)。我试图配置IPython并对sshd_config
文件进行了一些更改。为了使这些更改生效,我运行了这个命令:
sudo service sshd restart
从那时起,我无法登录该机器。我尝试从其他9个节点连接,但是徒劳无功。 (我试过ssh user@IP
)
我不知道发生了什么。
我已经搜索过恢复文件..但是,所有解决方案都是我们能够登录的时候。但是在这里,我们甚至都无法登录机器......那么我怎么改变任何东西....有什么方法我可以从其他9个节点做......有点像......应用同样的东西其余9个节点sshd_config
到受损节点,请帮助...... BTW ...... 10节点集群是AWS EC2实例。
答案 0 :(得分:0)
sshd_config
文件中可能存在阻止sshd成功启动的错误。通常情况下,sudo service sshd restart
会在重新启动之前检查错误(使用sshd -t
),但似乎不会发生这种情况。
听起来你已经失去了与这台服务器的连接,而且由于sshd现在无法启动,你就被锁定了。
如果此EC2实例受EBS支持,您可以通过在另一个实例上挂载根卷,编辑sshd_config文件来修复错误并重新启动原始实例来解决此问题。描述的过程in this question基本上就是你需要做的。