如何从cassandra检索宽分区?

时间:2018-03-21 12:44:24

标签: cassandra

我们在cassandra中有一些大的分区,我想看看是什么导致了大分区。是否有工具从cassandra中获取分区数据并进行分析?现在,即使从分区中选择单行,cqlsh查询也会超时。

1 个答案:

答案 0 :(得分:1)

这可能取决于你获得超时的原因,但还有一些选择。

  • column_index_size_in_kb中的cassandra.yaml增加到类似1024的内容并重建sstables。这适用于广泛的分区索引引入的对象分配问题。
  • 增加堆大小。
  • 增加read_request_timeout_in_ms
  • 增加密钥缓存大小(nodetool setcachecapacity 1000 0 0)然后进行读取。观看阅读阶段直到零,然后再次尝试请求。除非群集基本上未使用,否则这很难。即使在超时之后读取仍继续,一旦完成读取索引它将缓存它,因此以下读取将跳过该部分(通常是最差的)将显着加速
  • 使用sstabledump或sstabletools
  • 从sstable中提取原始数据