将数据从多节点Cassandra集群移动到单个节点实例

时间:2011-07-12 00:29:09

标签: language-agnostic export cassandra

我目前有一个脚本在模式bin/sstable2json的所有文件上调用/var/lib/cassandra/data/fake-keyspace/*-Data.db,并将std的输出保存到磁盘。但是,导出的文件开始占用/var/lib/cassandra

中所有文件的10倍空间

我在阅读以下http://wiki.apache.org/cassandra/Operations#Import_.2BAC8_export

部分后采用了这种方法

将数据从一个群集导出到另一个群集的最佳做法是什么?为了清楚起见,我不是试图在环上添加额外的节点,而是在一个可重复的过程中将数据从一个环移出到另一个环。

非常感谢任何正确方向的帮助或推动。

1 个答案:

答案 0 :(得分:2)

只需复制sstable文件即可。使用json的唯一原因是(1)调试或(2)你想在重新加载之前以json形式进行某种处理。

因此,只需将所有sstable文件(从快照,如果您在第一个群集中实时运行)重命名为唯一数字(顺序无关紧要,只要它们是唯一的),并将它们全部复制到目标机器上的数据目录。