对于包含不可变时间序列数据的表,我知道最好使用TimeWindowCompactionStrategy
。
行由“ time_stamp
”字段聚类,并且客户端读取的查询被限制为每个主键最新的1000(或左右)行(客户端始终需要最新的行)。为此,我将time_stamp
字段配置为cluster ordered by time_stamp desc
例如,查询可能类似于:
"SELECT activity_type, activity_data from latest_user_activities where user_id = some_condition limit 1000;"
我的行插入的TTL
为90天或365天,具体取决于activity_type
字段的值,而activity_data
包含与执行的活动有关的元数据。
通常,我不确定应如何配置“ compaction_size
”。
“压缩窗口”应与插入的行的TTL对齐,还是在给定的时间窗口中预期包含多少行