如何检索一个非常大的cassandra表并从中删除一些不使用的数据?

时间:2015-09-08 03:50:03

标签: cassandra

我哈瓦创建了一张拥有2000万条记录的cassandra表。现在我想删除一个无主键列决定的过期数据。但它不支持对列的操作。所以我尝试检索表并逐行获取数据以删除数据。遗憾的是,它太大而无法检索。否则,我无法删除整个表格,我怎样才能达到目标?

1 个答案:

答案 0 :(得分:0)

您的问题实际上是如何从批量处理表中获取数据(也称为分页)。

您可以通过从主键中选择不同的切片来执行此操作:例如,如果您的主键是某种ID,请每次选择一系列ID,处理结果并执行您想要对其执行的操作,然后获得下一个范围,依此类推。

另一种方式,取决于您正在使用的驱动程序,将使用fetch_size。您可以看到Python示例here和Java示例here