为什么读取cassandra数据可以跳过一些数据?

时间:2016-08-03 01:38:39

标签: python-2.7 cassandra datastax-enterprise

当我每分钟读取cassandra表时,它会遗漏一些数据,例如,假设现在是2016-08-03 09:00:00,表有1000行数据,但我只读了600行数据。如何我能解决这个问题吗?没有错误信息

1 个答案:

答案 0 :(得分:0)

请检查复制因子(多个节点上的数据副本数)和Consistency Level

假设您已配置4节点cassandra-cluster设置,并为复选框空间配置了复制因子3。对于您插入的任何数据,最终将提供三份数据副本。这是为了恢复任何节点的故障。在此设置中,即使一个节点关闭,cassandra也将正常运行。

根据您的需要,您可以在cassandra中配置一致性。我怀疑你在这里使用低准备一致性。您可以尝试将读取一致性作为' Quorum'。