Datastax Enterprise 5.0群集重新平衡尝试失败

时间:2016-10-17 05:46:15

标签: cassandra datastax datastax-enterprise datastax-startup

我们有一台4台机器的DSE 5.0群集。在数据摄取期间,其中一台机器存储了大部分数据(100G),而其他三台机器存储的数据少得多(每台约15G)。我不知道为什么会这样,并计划调查,并可能在另一个问题上提出要求。

现在我尝试重新平衡群集。我知道的唯一一种方法就是点击Cluster Actions - > OpsCenter中的Rebalance。重新平衡开始并在约5分钟后重现中止此错误:

Rebalance Failed: java.rmi.UnmarshalException: Error unmarshaling return header; nested exception is: 
java.net.SocketTimeoutException: Read timed out

有些数据是按照重新平衡预览中的建议传输的,大部分都不是。

事件日志:

Error   Rebalance failed: java.rmi.UnmarshalException: Error unmarshaling return header; nested exception is: java.net.SocketTimeoutException: Read timed out       admin
Info    Moving node xx.xx.xx.xx from token 5848419665553670365 to 2542108353485192999   NODE-04 
Info    Starting rebalance

可能是什么原因以及如何调查和修复它?

群集部署在Azure上的4台专用计算机上。

1 个答案:

答案 0 :(得分:0)

数据加载后,您不必重新平衡群集。您可能希望深入挖掘数据模型,并确保您的分区键能够在环上均匀分布数据。在这种情况下,我怀疑是热点。