我读过关于Cassandra备份&在这里恢复,并有几个问题:
任何见解都将不胜感激。
答案 0 :(得分:4)
请尝试将您的问题限制在一个实际问题中。
本机Cassandra CLI命令是否足够?
我认为你的意思是nodetool snapshot
,所以在大多数情况下,"是的。"此外,许多用户还选择启用incremental backups。结合使用快照和增量备份(来自链接的文档)" 提供了可靠的,最新的备份机制。"
我看到很多人编写脚本并自定义自己的解决方案。
我有一个每晚在我的节点上运行的备份脚本。这有两个原因。
我不想每周为每个键空间手动拍摄快照,所以我有脚本执行此操作。
快照和增量备份文件不会自行删除,因此我会在一定的时间阈值后执行该脚本。
你会为Cassandra备份和恢复推荐哪些其他工具?
DataStax OpsCenter allows you to schedule backups,但我认为这只是企业版中的有效选项。您还可以查看名为Priam的Netflix的Cassandra备份/恢复工具。还有一家名为Talena的公司声称为Cassandra提供了广泛的企业级备份解决方案(我不认识任何使用它们的人,但他们最近给我打了一封营销电子邮件,所以我以为我会提到它。)
如果我选择备份我的Cassandra表,是否需要对存储进行大量投资?
增量备份和快照可能会占用大量空间,如果您不掌握它们(删除和/或存档它们)。我会尝试两种方式,并在你做的时候留意你的磁盘使用情况。如果您的业务需求有关于服务条款的声明(您需要恢复到多远),您应该能够确定有多少天的备份对您来说是有意义的。这应该告诉你是否需要更多的磁盘来履行这些义务。
编辑20181205
您是否在每个节点上运行nodetool快照?如果有三个节点具有100%复制,那么该方法会是什么。
通常是,nodetool snapshot
需要在每个节点上运行。这有助于确保备份覆盖,因为并非所有节点都可能负责所有数据。
但是,如果您的群集在节点数等于RF的配置中运行,则每个节点都有一个完整的数据副本。在那个的情况下,您只需要在一个节点上运行nodetool snapshot
;只要您确信维修定期运行且数据一致。
答案 1 :(得分:2)
关于Cassandra的时间点备份和恢复,根据您的需求和限制,您需要考虑以下几个方面:
如果您正在寻找用于Cassandra备份和恢复的企业级解决方案,您可能需要查看“Datos IO”提供的解决方案。它可将存储空间减少3倍,同时还提供故障恢复和集群一致性。