我正在阅读cassandra yml来调整一些参数以优化性能。
# Throttles compaction to the given total throughput across the entire
# system. The faster you insert data, the faster you need to compact in
# order to keep the sstable count down, but in general, setting this to
# 16 to 32 times the rate you are inserting data is more than sufficient.
# Setting this to 0 disables throttling. Note that this account for all types
# of compaction, including validation compaction.
compaction_throughput_mb_per_sec: 16
这里cassandra建议保持“compaction_throughput_mb_per_sec”数据插入速率的16到32倍。我们正在以非常高的速率插入数据的批量加载器插入数据。我应该更改此设置吗?或者它应该保持不变?
答案 0 :(得分:4)
那么您是否了解批量加载程序每秒将推送多少数据?这是一个持续的负载还是突发性的?如果您确实知道这一点,那么您基本上只需遵循该参数的配置文件注释中的指南。
我怀疑您没有这些信息,在这种情况下,问题是您的系统是否行为不当(您目前是否看到问题?)。对不起,我不知道一个好的方法来预测,这是一个调整练习。你想找到一个值,保证Cassandra不会在压缩方面落后,但同时你不希望压缩杀死你的磁盘i / o。解决问题的唯一方法就是尝试观察。