应用错误收集

为什么读取cassandra数据可以跳过一些数据？

时间：2016-08-03 01:38:39

标签： python-2.7 cassandra datastax-enterprise

当我每分钟读取cassandra表时，它会遗漏一些数据，例如，假设现在是2016-08-03 09:00:00，表有1000行数据，但我只读了600行数据。如何我能解决这个问题吗？没有错误信息

1 个答案:

答案 0 :(得分：0)

请检查复制因子（多个节点上的数据副本数）和Consistency Level。

假设您已配置4节点cassandra-cluster设置，并为复选框空间配置了复制因子3。对于您插入的任何数据，最终将提供三份数据副本。这是为了恢复任何节点的故障。在此设置中，即使一个节点关闭，cassandra也将正常运行。

根据您的需要，您可以在cassandra中配置一致性。我怀疑你在这里使用低准备一致性。您可以尝试将读取一致性作为＆＃39; Quorum＆＃39;。