我正在尝试通过对当前架构使用cassandra-stress来评估日期和级别压缩策略。
我有一个现有的数据集,我试图反对但收效甚微,但我不反对用“乱码”数据进行测试。我真正想要的是集群的突破点。
columnspec:
- name: id
population: gaussian(1000)
- name: date
cluster: fixed(14)
- name: session_token
size: fixed(30)
cluster: fixed(10000)
insert:
partitions: fixed(1)
batchtype: UNLOGGED
select: fixed(1)/14000
我已经远远地在我的查询列表中手动键入一个没有变量Select * from table where id=500 and date > '2016-08-01';
的完整查询,虽然这会产生大量的iops,但即使我的数据集产生结果,它也会返回每秒0行通过cqlsh。
或者,当我尝试使用这些columnspec进行插入时,我遇到的问题是我的批量大小太大。 (在这种情况下,我只测试了一个docker容器而不是真正的集群,以免污染我的测试数据集。)
我已经完成了cassandra-stress工具教程并对任何架构教程进行了基准测试,但无法解决我的问题。我希望这是因为缺乏对该主题的深刻理解....
对此的任何帮助将非常感谢。提前致谢
答案 0 :(得分:-2)
使用“insert”设置 - select:fixed(1)/ 14000 - 表示cassandra-stress将在每次操作时尝试10次插入。批量大小10似乎并不坏,所以我很惊讶这是一个问题。你试过 - 修复(1)/ 140000?这将导致每次操作一次插入。