清理Cassandra增量备份文件夹的最佳实践

时间:2015-01-06 17:59:11

标签: cassandra backup

我们在Cassandra集群上有增量备份。 "备份"数据文件夹下的文件夹现在包含大量数据,其中一些文件包含数百万个文件。

根据documentation:" DataStax建议每次创建新快照时设置清除增量备份硬链接的过程。"

我不清楚清除这些文件的最佳方法是什么。是否可以在创建快照时删除它们,还是应该删除超过特定时间段的文件?

我的想法是,为了安全起见,运行常规脚本删除超过30天的文件:

find [Cassandra data root]/*/*/backups -type f -mtime +30 -delete

我太小心了吗?我们并不关心拥有较长的备份历史记录。

感谢。

1 个答案:

答案 0 :(得分:12)

你可能太小心了,虽然这并不总是坏事,但有很多考虑因素。一个好的模式是拥有多个快照(例如,每周快照返回到某个时间段)以及该时间段内的所有备份,以便您可以恢复到已知状态。例如,如果由于某种原因,您最近的快照无论出于何种原因都不起作用,如果您从那时起仍然拥有以前的快照+所有sstables,则可以使用它。

您可以删除快照后所有已创建的备份,作为执行快照刷新的操作并将所有sstables硬链接到快照目录。只需确保您的快照实际上正在发生并完成(这是一个非常可靠的过程,因为它是硬链接),然后再删除旧的快照&删除备份。

您还应确保测试恢复过程,以便您了解所需的内容。您应该能够从上一个快照还原自那时起备份的sstables。启动新群集并尝试从快照+备份中恢复数据,或者在测试环境中尝试此过程,这是一个好主意。

我想指出这篇文章:'Cassandra and Backups'作为备份和恢复cassandra的良好尝试。