我们将Druid用作时间序列数据库,并且有一个用例,其中的一些数据需要删除。
我知道我们无法运行直接删除操作,并且该技术本身不是为此设计的
可以通过哪些方式实现?
答案 0 :(得分:2)
通常处理此问题的方法是使用过滤器为其自身重新建立段索引。
如果使用ingestSegmentFirehose,则可以直接为数据重新索引,并且通过添加过滤器可以消除行。
http://druid.io/docs/latest/ingestion/firehose.html#ingestsegmentfirehose
答案 1 :(得分:1)
德鲁伊存储数据和工作的方式不允许删除特定的数据行,而是可以在段级别进行删除。因此,如果您有一种细分数据的方式,可以将来将其删除,则可以相应地设置片段并触发删除任务。
另一种方法是使用加载规则来不基于某些规则加载某些段或数据集,尽管数据仍存在于深度存储中。