我正在玩我自己的笔记本电脑上的cassandra-stress工具(8核,16GB),Cassandra 2.2.3开箱即用,配备了库存配置。我正在做的就是这里所描述的:
http://www.datastax.com/dev/blog/improved-cassandra-2-1-stress-tool-benchmark-any-schema
测量其插入性能。
我的观察是:
文档说不过Cassandra每个分区最多可以支持20亿行。我不需要那么多,我不知道每个分区只有5000条记录可以减慢写入次数10次或者我错过了什么?
答案 0 :(得分:1)
支持与"最佳表现有点不同"。您可以拥有非常宽的分区,但经验法则是尝试将它们保持在100mb以下,以实现misc性能。当整个分区可以存储在存储器中时,可以更有效地执行一些操作。
作为一个例子(这是一个老例子,这是一个完整的非问题2.0版,其中一切都是单通)但在某些版本中,当大小> 64mb时,压缩有两个通过过程,这会使压缩吞吐量减半。它仍然适用于巨大的分区。我见过许多工作得很好的多gb。但是具有大分区的系统难以在操作上工作(管理压缩/修复/ gcs)。
我会说最初的目标是100mb的经验法则并从那里进行测试以找到自己的最佳状态。根据用例,事情总是会有不同的行为,为了最大限度地利用节点,你可以做的最好的是一些最接近你要做的基准(对所有系统都是如此)。这似乎是你已经做过的事情,所以你肯定是在正确的道路上。