在生产中使用Cassandra 1.2 Vnodes

时间:2013-10-14 00:44:26

标签: cassandra

自从Vnodes与Cassandra 1.2一同发布以来已过去一年。我已经阅读了几篇描述此功能的Datastax文章,他们说这个功能很棒,但我想问那些使用它的人在制作中

  1. 它真的稳定并准备好生产吗?
  2. 修复运行时修复速度和磁盘使用开销怎么样?对我们非常重要
  3. 如何重新平衡速度?
  4. 在启用Cassandra vnodes的情况下使用Hadoop稳定性/性能怎么样?
  5. 我什么时候应该避免使用vnodes?
  6. 每个节点有1.5Tb,RF = 3。当我打开vnodes时,所有数据都将被重新分配?我关心的是网络

1 个答案:

答案 0 :(得分:2)

我无法回答您的所有问题,但这是我可以提供的帮助。

  1. 维修只受vnodes的轻微影响。假设每个节点有256个令牌,则修复任务的数量是修复任务数量的256倍,每个任务数量要小256倍。除了非常少量的数据之外,创建额外任务的额外开销可以忽略不计。因此,我认为您不会注意到使用1.5 TB数据进行修复时存在任何差异。

  2. 您无需使用vnodes进行重新平衡。添加和删​​除节点时,群集保持平衡。

  3. 升级到vnodes是最大的挑战。几乎所有数据都需要重新分配。这可以通过shuffle(实际上不能很好地工作,因此不推荐),退役和引导每个节点(使一个节点临时存储所有数据的副本)或通过复制硬件和创建新的虚拟数据中心,然后退役旧的。