读cassandra中的错误

时间:2016-05-09 11:19:36

标签: cassandra

我在尝试从Cassandra表中读取数据时遇到了堰错误。我有一个单节点安装,默认设置。这是我正在进行的查询:

  SELECT component_id,
         reading_1,
         reading_2,
         reading_3,
         date
  FROM component_readings
  WHERE park_id=2
        AND component_id IN (479)
        AND date >= '2016-04-09+0000'
        AND date <= '2016-05-08+0000';

component_readings是一个简单的表,没有聚类条件:

CREATE TABLE component_readings (
    park_id int,
    component_id int,
    date timestamp,
    reading_1 decimal,
    reading_2 decimal,
    ...
    PRIMARY KEY ((park_id), component_id, date)
);

使用某些component_id值,它可以正常工作,而对于其他值,它会失败。这是我得到的错误:

cassandra.ReadFailure: code=1300 [Replica(s) failed to execute read] 
message="Operation failed - received 0 responses and 1 failures"
info={'required_responses': 1, 'received_responses': 0, 'failures': 1,
'consistency': 'LOCAL_ONE'}

cassandra的system.log显示了这个错误:

ERROR [SharedPool-Worker-1] 2016-05-09 15:33:58,872 StorageProxy.java:1818 - 
Scanned over 100001 tombstones during query 'SELECT * FROM xrem.component_readings
WHERE park_id, component_id = 2, 479 AND date >= 2016-04-09 02:00+0200 AND date <=
2016-05-08 02:00+0200 LIMIT 5000' (last scanned row partion key was ((2, 479),
2016-05-04 17:30+0200)); query aborted

奇怪的是,我只在从外部程序(通过python cassandra-connector)进行查询时才得到错误。如果我直接在cqlsh shell中创建它,它可以很好地工作。

我的安装是cassandra 2.2,但我已升级到3.5,我也遇到了同样的错误。

1 个答案:

答案 0 :(得分:14)

您已超过tombstone_failure_threshold。它默认为100'000。你可以

  • 增加cassandra.yaml或
  • 中的值
  • 清理你的墓碑

执行后者alter你的表并将gc_grace_seconds设置为0:

ALTER TABLE component_readings WITH GC_GRACE_SECONDS = 0;

然后通过nodetool触发压缩。这将清除所有墓碑。

在单节点群集的特定方案中,您可以将GC_GRACE_SECONDS保留为零。但是,如果你这样做,请记住,如果你想使用多个节点,请撤消这个!