德鲁伊队列分析?

时间:2017-05-14 22:43:23

标签: analysis druid churn

我们收集的网站流量数据大约为5万到10万 每天独一无二的访问。

队列分析:

查找24小时内注册的用户百分比 网站,然后实际去我们的采购页面(计算 在第一,第二,第三等用户中执行此操作的百分比 注册后一小时)。

两个非常简短的示例文档:

  • sessionId:执行计数的唯一标识符
  • url:评估同类群组的网址
  • time:事件的unix时间戳

{ “sessionId”:“some-random-id”, “时间”:1428238800000,(unix时间戳:4月5日,下午3:00) “url”:“/ register” }

{ “sessionId”:“some-random-id”, “时间”:1428241500000,(unix时间戳:4月5日,下午3:45) “url”:“/ buy” }

如果我想在一段时间内进行相同的聚合,例如6 几个月想检查回头客的执行队列?该 数据集太大了。

旁注:我也不想获得100%准确的结果, 近似值足以用于趋势分析。

我们能用德鲁伊实现这一目标吗?或者它不适合这种分析?还有什么比队列分析更优秀吗?

1 个答案:

答案 0 :(得分:0)

我认为你可以用德鲁伊和数据草图来做到这一点。 看看最后一个例子是page 如果您想使用这种近似方法,您可以查看here以了解近似的约束误差以及您可以为交易记忆的准确性做出的权衡。