有可能加载最新的可用数据点并丢弃其余的德鲁伊?

时间:2017-02-09 14:42:13

标签: druid

考虑timestamp | compoundId | dimension 1 | dimension 2 | metric 1 | metric 2

形式的原始事件(德鲁伊用语中的字母设置)

通常在德鲁伊数据中,可以根据某些规则将数据加载到实时节点和历史节点中。这些规则似乎与时间范围有关。例如:

  • 在方框A
  • 上加载最后一天的数据
  • 在方框B
  • 上加载上周(除了最后一天)
  • 将其余部分保存在深层存储中但不加载段。

相反,我想支持以下用例:

  • 在方框A上为每个给定的compoundId加载最后一个事件。无论最后一个事件是否恰好在今天或昨天加载。

这可能吗?

或者,如果以上情况不可能,我认为可能有可能作为一种解决方法来创建一个betaset(最好的颗粒化水平如下):

给定上面定义的带有模式的alphaset,创建一个betaset,以便:

  • 汇总了给定compoundId的所有事件。
  • metric1metric2设置为上次发生(最大时间戳)事件的指标。

任何建议都非常感谢。

1 个答案:

答案 0 :(得分:0)

我相信first and last aggregators正是您所寻找的。