我们收集的网站流量数据大约为5万到10万 每天独一无二的访问。
队列分析:
查找24小时内注册的用户百分比 网站,然后实际去我们的采购页面(计算 在第一,第二,第三等用户中执行此操作的百分比 注册后一小时)。
两个非常简短的示例文档:
{ “sessionId”:“some-random-id”, “时间”:1428238800000,(unix时间戳:4月5日,下午3:00) “url”:“/ register” }
{ “sessionId”:“some-random-id”, “时间”:1428241500000,(unix时间戳:4月5日,下午3:45) “url”:“/ buy” }
如果我想在一段时间内进行相同的聚合,例如6 几个月想检查回头客的执行队列?该 数据集太大了。
旁注:我也不想获得100%准确的结果, 近似值足以用于趋势分析。
我们能用德鲁伊实现这一目标吗?或者它不适合这种分析?还有什么比队列分析更优秀吗?