应用错误收集

我正在玩我自己的笔记本电脑上的cassandra-stress工具（8核，16GB），Cassandra 2.2.3开箱即用，配备了库存配置。我正在做的就是这里所描述的：

测量其插入性能。

我的观察是：

使用https://gist.github.com/tjake/fb166a659e8fe4c8d4a3中的代码而没有任何修改我有~7000次插入/秒。
当将上面的代码中的第35行（cluster：fixed（1000））修改为“cluster：fixed（100）”时，i。即配置我的测试数据分布有100个聚类键而不是1000个，性能上升到~11000个插入/秒
配置每个分区有5000个群集密钥时，性能会降低到 700 insert / sec

文档说不过Cassandra每个分区最多可以支持20亿行。我不需要那么多，我不知道每个分区只有5000条记录可以减慢写入次数10次或者我错过了什么？

支持与＆＃34;最佳表现有点不同＆＃34;。您可以拥有非常宽的分区，但经验法则是尝试将它们保持在100mb以下，以实现misc性能。当整个分区可以存储在存储器中时，可以更有效地执行一些操作。

作为一个例子（这是一个老例子，这是一个完整的非问题2.0版，其中一切都是单通）但在某些版本中，当大小> 64mb时，压缩有两个通过过程，这会使压缩吞吐量减半。它仍然适用于巨大的分区。我见过许多工作得很好的多gb。但是具有大分区的系统难以在操作上工作（管理压缩/修复/ gcs）。

我会说最初的目标是100mb的经验法则并从那里进行测试以找到自己的最佳状态。根据用例，事情总是会有不同的行为，为了最大限度地利用节点，你可以做的最好的是一些最接近你要做的基准（对所有系统都是如此）。这似乎是你已经做过的事情，所以你肯定是在正确的道路上。