Question

我有一个AWS EC2 Cassandra 1.2.8群集在6个m1.large实例上运行，并且jna.jar可用。我正在进行一些灾难恢复测试，我从s3下载数据的快照并将其安装在新的集群上。然后我尝试在节点上运行nodetool修复。经过一段时间（可能是一个小时左右），我会定期收到消息

failed with error java.io.IOException: Cannot proceed on repair because a neighbor (/10.0.22.162) is dead: session failed

当我登录10.0.22.162时，我看到CassandraDaemon java进程仍在运行，但netstat -ant表示实例不再侦听端口9160.

查看cassandra记录我看到的最后一件事：

INFO [AntiEntropyStage:1] 2013-08-20 16:08:53,340 AntiEntropyService.java (line 245) [repair #cdb7f2a0-09b2-11e3-bc42-4bd65b6bc771] Sending completed merkle tree to /10.0.32.59 for (dummy,foo)
ERROR [Thread-1657] 2013-08-20 16:08:53,828 FileUtils.java (line 381) Stopping RPC server
INFO [Thread-1657] 2013-08-20 16:08:53,828 ThriftServer.java (line 116) Stop listening to thrift clients
ERROR [Thread-1657] 2013-08-20 16:08:53,830 FileUtils.java (line 387) Stopping native transport
INFO [Thread-1657] 2013-08-20 16:08:53,838 Server.java (line 151) Stop listening for CQL clients

有没有人知道我可以在哪里/如何追踪这一点，并弄清楚为什么节俭服务器会进行长假？

我知道nodetool修复是一个过程的猪，所以如果有人告诉我它是资源限制的，我可能需要更多关于如何跟踪它的信息。

Cassandra ERROR在维修期间停止听节俭的客户

0 个答案: