我目前有一个脚本在模式bin/sstable2json
的所有文件上调用/var/lib/cassandra/data/fake-keyspace/*-Data.db
,并将std的输出保存到磁盘。但是,导出的文件开始占用/var/lib/cassandra
我在阅读以下http://wiki.apache.org/cassandra/Operations#Import_.2BAC8_export
部分后采用了这种方法将数据从一个群集导出到另一个群集的最佳做法是什么?为了清楚起见,我不是试图在环上添加额外的节点,而是在一个可重复的过程中将数据从一个环移出到另一个环。
非常感谢任何正确方向的帮助或推动。
答案 0 :(得分:2)
只需复制sstable文件即可。使用json的唯一原因是(1)调试或(2)你想在重新加载之前以json形式进行某种处理。
因此,只需将所有sstable文件(从快照,如果您在第一个群集中实时运行)重命名为唯一数字(顺序无关紧要,只要它们是唯一的),并将它们全部复制到目标机器上的数据目录。