从cassandra输出有限的数据

时间:2014-03-19 13:01:25

标签: cassandra

我有Cassandra cluster C1Cassandra cluster C2,C1有数百万的数据,我想只加载从C1到C2的少量数据,例如100K。如何在C1中的百万个数据中仅导出100K数据并将该100K数据加载到C2集群

1 个答案:

答案 0 :(得分:2)

您必须编写一个自定义应用程序来执行此操作;使用内置工具无法做到这一点。

我能想到的唯一例外是,如果您要导入的数据是连续的,您可以将一组有限的SStables复制到新的群集中,然后修剪掉不包含的数据。属于运行DELETE FROM个查询。但目前还不清楚这是否可以在实践中节省您的时间,因为您必须明确指定要删除的每个主键。