在Druid中编写自定义扩展

时间:2019-03-14 19:00:14

标签: druid

我是Druid的新手。

问题陈述
我们目前确实将原始事件数据推送到Druid。我需要对数据进行某些计算(例如像某些统计技术一样),而Druid或它提供的扩展扩展不支持这些计算。

我有两个问题-

  1. 有什么更好的方法来实现这一目标? (是否有一些外部脚本可以从Druid读取数据,计算计算结果并将其放回Druid)?
  2. 我可以采用在Druid上编写自定义扩展的方法吗?我找不到任何有关如何编写/测试Druid Extensions的好的文档。

这些链接未提供任何深入信息- http://druid.io/docs/latest/development/modules.html

https://github.com/apache/incubator-druid(具有某些核心和社区贡献扩展的Druid回购)

对此表示感谢。谢谢。

1 个答案:

答案 0 :(得分:0)

现在您可以同时实现这两种方式,这取决于您自己编写扩展并维护它的舒适程度。与其他方式相比,这无疑是很耗时的。

  1. 如果从德鲁伊读取数据,然后执行计算并将数据写回德鲁伊,则最终将写入单独的表。如果您没有存储在德鲁伊集群上,那么您当然可以走这条路,而且耗时少。

  2. 是的,这是对数据执行任何自定义计算的推荐方法。您当然可以轻松编写一个简单的扩展名。这是示例git hub repo链接,可帮助编写自定义druid扩展:Matplotlib: Adding an axes using the same arguments as a previous axes