我已经成功设置了ELK堆栈。 ELK给了我很好的数据见解。但是,我不确定我将如何获取以下结果。
我要说的是,我有一列user_id
和action
。实际值可以是installed
,activated
,engagement
和click
。所以,我希望如果特定用户在5月21日和6月21日执行了活动installed
,那么在获取6月份的结果时,ELK不应该返回之前已经执行过该活动的用户。例如,对于下表: -
Date UserID Activityin the previous month
1 May 1 Activated
3 May 2 Activated
6 May 1 Click
8 May 2 Activated
11 June 1 Activated
12 June 1 Activated
13 June 1 Click
User1和User2分别在1May和3May上激活。 User2也已在8月5日激活。因此,当我过滤具有活动Activated
的五月份的用户时,它应该返回我2
计数,即
1 May 1 Activated
3 May 2 Activated
正在删除8月5日的User2,因为它之前已执行过相同的活动。
现在,如果我为6月份编写相同的查询,它应该不返回任何内容,因为相同的用户也会提前执行相同的活动。
如何在ELK中编写此查询?
答案 0 :(得分:0)
使用ElasticSearch无法进行此类关系查询。
您需要添加另一列(FirstUserAction)并在加载数据时填充它,或者安排任务(以您熟悉的任何脚本/编程语言)来定期计算和更新此列的值