我有分析服务器(例如点击计数器)。我想用一些api向德鲁伊发送数据。我该怎么办? 我可以用它作为谷歌分析的替代品吗?
答案 0 :(得分:4)
正如se7entyse7en所说:
您可以将数据摄取到Kafka,然后使用德鲁伊的Kafka firehose通过实时摄取将您的数据摄取到德鲁伊。 之后,您可以使用其api以交互方式查询德鲁伊。
必须说,只能在德鲁伊realtime nodes上设置firehoses。
以下是如何设置Kafka firehose的教程:Loading Streaming Data。 在Kafka firehose旁边,你可以设置其他提供的消防 - 亚马逊S3 firehose,RabbitMQ firehose等...... including them你甚至可以编写自己的firehose作为扩展,例如here。以下是all druid extensions。
必须说德鲁伊正在将real-time ingestion从realtime nodes转移到Indexing service,正如here所述。
答案 1 :(得分:2)
您可以将数据摄取到Kafka,然后使用德鲁伊的Kafka firehose通过实时摄取将您的数据摄取到德鲁伊。之后,您可以使用其api以交互方式查询德鲁伊。
答案 2 :(得分:2)
现在,最佳做法是在Indexing Service上运行实时索引任务,然后您可以使用德鲁伊的API将数据发送到此任务。您可以直接使用API,但使用Tranquility要容易得多。它是一个库,可以自动为新段创建新的实时索引任务,并且它允许您将消息发送到正确的任务。您还可以设置复制和分片级别等。只需运行索引服务,使用Tranquility即可开始向Druid发送消息。
答案 3 :(得分:0)
最好的使用方法,考虑到你的德鲁伊是0.9.x版本是宁静。其余的api非常可靠,允许您控制数据模式。在druid.io quickstart页面上点击了#34;加载流数据"部分。
我正在为我们的网站实时加载点击流数据并且一直运作良好。所以,是的,你可以用德鲁伊取代谷歌分析(假设你有所需的基础设施)。