如何验证从密钥空间的一个表复制到Cassandra中不同键空间中的表的数据?

时间:2016-08-25 06:21:13

标签: validation cassandra datastax cql cassandra-2.0

我们正在将数据从密钥空间中的列族复制到同一数据中心中的另一个密钥空间。我们想验证cf的大小或是否。复制的记录与源cf的记录相同。 有没有办法测量整个集群中cf的大小?

1 个答案:

答案 0 :(得分:1)

AFAIK Cassandra不会维护每个表/每个群集的行数。通常,它取决于您的数据集大小:

  • 小数据集:运行select count(*) from <table> limit <max_number_of_rows>
  • 大数据集:使用cassandra驱动程序编写脚本,该驱动程序通过all表扫描(使用分页),计算所有行
  • 大数据集,第二种方式:使用cqlsh copy将表转储到csv文件,然后计算行数。
  • 非常大的数据集:使用Spark + Cassandra连接器在整个集群中分配负载。