我有一个包含大量数据的3节点数据集cassandra(社区)群集。我有几张表,其中包含3-5亿条记录。我想从这些表中删除超过90天的数据。
问题是我如何运行一个没有超时运行的选择查询。我目前正在查询
下面运行 NOW = $(日期-d" -3个月" +"%Y-%m-%d")
从table_name中选择day_ts,其中minute_ts< ' $ NOW'限制100000允许过滤;
即使我限制了选择查询结果,它仍将解析整个3-5亿条记录,然后过滤数据。
请建议什么是有效的方法来做到这一点。
答案 0 :(得分:0)
这是设计的。 “允许过滤”查询无法扩展。您应该更改数据模型以满足您的查询。如果继承了此模型,则必须读取整个数据集并使用其他模型再次存储。没有逃脱...