Cassandra每年的灾难恢复演习

时间:2016-10-05 04:59:08

标签: cassandra

为了满足年度灾难恢复练习的业务需求,对(3node-dc1)(3node-dc2)配置中的Cassandra设置有什么好的建议吗?

练习是模拟DR激活,但生产工作负载仍然使用DC1进行服务。

在起搏时间内,DC1是处理工作负载的主要DC,DC2仅在Cassandra节点上运行spark分析,没有其他工作负载。

1 个答案:

答案 0 :(得分:1)

您是在使用云(如AWS,Google云服务)还是在专用硬件中运行数据库? 你提到了2个数据中心,它们是同一个集群的一部分吗?

如果您准备好应对任何意外情况,那么不仅仅是为了遵守您的年度灾难恢复运动而进行的特殊配置:

  • 有定期和自动备份,
  • 在我们的案例中,我们采用存储在S3上的完整每日快照,包含过期策略(仅限最新的7个每日备份,最后4个每周备份,最后3个月备份)
  • 验证是否可以恢复备份,这通常在临时AWS EC2实例上完成
  • 在已恢复的实例中进行的测试或研究不会与生产群集通信,一旦测试完成,实例就会终止

更多细节,同事为Cassandra Summit 2016发表了关于我们流程的详细信息。