以10分钟为间隔将Pandas Dataframe分组,并在每个子DataFrame上计算Shannon熵,然后合并结果

时间:2018-06-21 20:32:07

标签: pandas dataframe entropy

我目前正在努力处理熊猫数据框。我有一个包含四列的pandas数据框,我想:

1 +根据时间列(间隔10分钟)将此数据帧分组为子数据帧。

2 +在每个结果数据帧上,在四列中的每一列上应用香农熵。

3 +将在上一步中获得的结果合并到最终数据框中。

这是我的数据框的样子:

my_time id_orig_h   id_orig_p   id_resp_h   id_resp_p               
2018-06-18 02:04:03.967008  192.139.153.30  26949   40.97.131.114   443
2018-06-18 08:04:38.839383  192.139.153.30  42384   40.97.144.50    443
2018-06-18 19:13:15.984411  192.139.153.244 35178   40.97.114.130   443
2018-06-19 03:06:00.182532  192.139.153.30  35668   40.97.130.34    443
2018-06-19 03:43:38.484621  192.139.153.30  52845   40.97.130.18    443
2018-06-19 07:03:36.172746  192.139.153.30  24417   13.89.217.116   443
2018-06-19 07:18:55.593967  192.139.153.244 10887   40.97.114.130   443
2018-06-19 08:57:16.856116  192.139.153.30  34770   40.97.113.2 443
2018-06-19 09:02:10.184755  192.139.153.213 47535   212.92.47.81    443
2018-06-19 09:48:48.211221  192.139.153.30  43787   40.97.112.66    443
2018-06-19 10:45:06.545098  192.139.153.244 30875   40.97.130.210   443
2018-06-19 10:46:35.692965  99.233.53.244   55804   198.73.134.186  3544
2018-06-19 10:46:46.284706  99.233.53.244   56917   198.73.134.186  443
2018-06-19 11:11:15.796175  192.139.153.30  4529    204.225.107.168 7900
2018-06-19 11:42:20.410850  192.139.153.213 30654   52.112.64.158   443
2018-06-19 11:44:28.827162  192.139.153.213 30922   40.97.200.162   443
2018-06-19 11:44:30.530879  192.139.153.213 54614   40.97.200.162   443
2018-06-19 11:44:30.978958  192.139.153.213 35572   40.97.200.162   443
2018-06-19 11:44:33.910579  192.139.153.213 40321   40.97.200.162   443
2018-06-19 11:44:34.026077  192.139.153.213 35512   40.97.200.162   443

在此先感谢您的帮助。

0 个答案:

没有答案