Cassandra 2.1.2节点卡在加入集群上

时间:2014-12-02 14:12:37

标签: cassandra

我正在尝试但未能将新的(旧的,但已消失的)节点加入现有群集。

目前,群集由2个节点组成,并运行C * 2.1.2。我用2.1.2启动第三个节点,它进入加入状态,它引导,即流出一些数据,如nodetool netstats所示,但过了一段时间,它就会卡住。从那时起,没有任何内容被流式传输,新节点保持加入状态。我重新启动节点两次,每次它传输更多数据,但然后再次卡住。 (我目前正在进行第三轮比赛)。

其他事实:

  • 我在任何节点上的日志中都没有看到任何错误。
  • 连接似乎很好,我可以通过各种方式ping,netcat到端口7000。
  • 每个运行节点有267 GB负载,复制2,16个令牌。
  • 新节点的负载现在约为100GB
  • 我猜测经过几轮重启后的节点最终将从运行节点吸入所有数据并加入集群。但绝对不是它的工作方式。
编辑:我发现了更多信息:

  • 引导过程在流式传输某些表的过程中停止,总是在发送完10MB的某些SSTable之后,例如:

    $ nodetool netstats | grep -P -v "bytes\(100" Mode: NORMAL Bootstrap e0abc160-7ca8-11e4-9bc2-cf6aed12690e /192.168.200.16 Sending 516 files, 124933333900 bytes total /home/data/cassandra/data/leadbullet/page_view-2a2410103f4411e4a266db7096512b05/leadbullet-page_view-ka-13890-Data.db 10485760/167797071 bytes(6%) sent to idx:0/192.168.200.16 Read Repair Statistics: Attempted: 2016371 Mismatch (Blocking): 0 Mismatch (Background): 168721 Pool Name Active Pending Completed Commands n/a 0 55802918 Responses n/a 0 425963

我无法诊断错误&我会感激任何帮助!

1 个答案:

答案 0 :(得分:1)

  1. 尝试使用正确的端口从一个节点telnet到另一个节点。
  2. 确保您加入了正确的名称群集。
  3. 尝试使用:nodetool repair
  4. 您可能正在ping外部IP地址,并且您的群集使用内部IP地址进行通信。
  5. 如果您在Amazon AWS上运行,请确保在两个内部IP地址上都打开防火墙。