我在ec2(区域:us-east)上有一个spark(1.3.1)群集。自从过去两个月以来我一直没有遇到任何问题,但是从昨天开始我就不能ssh一个奴隶(或者我可以但真的很长一段时间)。我的工作不会失败,他们只是在等待和等待,因为他们正试图连接到一个奴隶而奴隶没有回答。
我尝试用spark-ec2创建一个新的火花,但是我收到了这个错误:
Foo f = (Foo) save(someFoo, true);
当我写一位同事报告另一个群集上的类似问题时:
Warning: SSH connection error. (This could be temporary.)
Host: 54.90.24.42
SSH return code: 255
SSH output: ssh: connect to host 54.90.24.42 port 22: Connection refused
.
Warning: SSH connection error. (This could be temporary.)
Host: XX.XXX.XXX.XX
SSH return code: 255
SSH output: ssh: connect to host XX.XXX.XXX.XX port 22: Connection refused
所有这些问题似乎都有联系。
有人知道它会是什么吗?