建议在Cassandra中使用的分区数量

时间:2019-06-06 17:17:30

标签: cassandra partitioning database-partitioning

尽管Cassandra允许-2 ^ 63到+ 2 ^ 63-1的分区数量,但是是否存在建议的最大分区数量,超出该数量可能会降低性能?

1 个答案:

答案 0 :(得分:2)

在每个节点大约10亿个分区之后,完全修复(非增量修复)开始出现严重的超流问题。尤其是对于较小的分区,因为验证压缩的运行速度较慢。

理想情况下,我会建议按分区 size 而不是计数。在大约100mb的分区上,您将获得更高效的压缩,而不会在读取时带来过多的分区索引开销。我对它并不太严格,尽管它在很多因素上都很动摇。首先尝试着重于为查询建模,然后如果所述模型最终具有太大或太小的分区(数以亿计或更多的sub 1k或任何多GB的分区-每个节点不总计),请对其进行微调。< / p>