通过将表导出为CSV文件并使用它在新集群中创建新表,我正在将数据在2.2.4版本的Cassandra集群之间迁移到3.11.3的集群之间。我正在使用SELECT COUNT(*)
来验证数据是否已正确复制,但是行数不一致。可能是因为版本不同吗?还有什么可以解释的吗?谢谢!
这是我正在执行的步骤:
SELECT COUNT(*) FROM table_cass2
count
-------
7951
(1 rows)
COPY table_cass2 TO '/tmp/table.csv'
COPY table_cass3 FROM '/tmp/table.csv'
Using 15 child processes
Starting copy of <table> with columns [..].
Processed: 7951 rows; Rate: 3741 rows/s; Avg. rate: 6045 rows/s
7951 rows imported from 1 files in 1.315 seconds (0 skipped).
SELECT COUNT(*) FROM table_cass3`
count
-------
7919
(1 rows)
答案 0 :(得分:0)
要回答我自己的问题,我们团队中的其他人确认,在Cassandra的不同实例之间进行SELECT COUNT(*)
查询的结果之间存在微小但一致的差异是正常的。