我最近几天读过一些关于德鲁伊的文章,并想知道这与Esper有什么不同。我一直在使用Esper进行实时事件处理。感觉德鲁伊凭借其简单的JSON(如查询和更简单的界面)来做到这一点。
有人可以纠正我并分享更多光吗?
修改
两者可以共存吗?
答案 0 :(得分:1)
我不认识德鲁伊,可以根据我在网站上看到的内容发表评论。德鲁伊似乎在存储解决方案领域与Impala,Redshift,Vertica,Cassandra和Hadoop进行了比较。它似乎是针对时间序列优化的商店然后查询,使用'主键'是时间对象。
Esper不会存储,而是在数据到达时进行分析,因此可能会实现更低的延迟和更高的吞吐量,因为它永远不会进入磁盘(除非具有高可用性)。德鲁伊似乎能够分析存储的时间序列数据,而这需要从另一个商店重播事件到Esper。
答案 1 :(得分:0)
德鲁伊集群由不同类型的节点组成,因此虽然有些是“存储然后查询”,但也有所谓的“实时”节点。来自Druid documentation:
实时节点提供实时索引。通过这些节点索引的数据可立即用于查询。实时节点将定期构建表示他们在某段时间内收集的数据的段,并将这些段传输到历史节点。
德鲁伊文档和博客中有关于如何在其中流式传输数据并立即查询数据的示例。因此,在这种意义上,它可以对Esper执行类似的操作,但也可以将数据存储在历史节点中以供稍后查询。它还可以通过Hadoop提取数据(显然不是实时处理),这意味着流数据可以修正为更正或丢失的数据。