我需要执行带时间戳的事件分析,以找出给定数据集的结果,即error_codes
组导致严重错误代码。让我们说 54645 是一个严重的错误代码,所以我需要知道导致此错误的错误代码是什么。我的数据集有1,59,600行。
id date_time error_codes
1 2015-04-16 16:25:33 54654
1 2015-04-16 16:25:34 55466
2 2015-04-16 16:30:00 54656
1 2015-04-17 17:25:33 654535
2 2015-04-17 17:30:33 5466456
2 2015-04-17 17:40:22 45646
3 2015-04-17 18:35:34 56464
1 2015-04-18 00:18:35 54645
3 2015-04-18 04:25:33 545646
..........................
我需要的结果如下:
{54654}-1sec-{55466}-1day1hour-{654535}----6hour53mins2sec---->{54645} Supp=0.02
此结果显示这3个错误代码导致严重错误代码,该数据集支持2%,这意味着如果我们在数据集中有100行,则会看到此模式两次。时间容差为1分钟 因此,如果出现任何类似的模式,应该考虑稍微的时间差异。