我目前正在努力处理熊猫数据框。我有一个包含四列的pandas数据框,我想:
1 +根据时间列(间隔10分钟)将此数据帧分组为子数据帧。
2 +在每个结果数据帧上,在四列中的每一列上应用香农熵。
3 +将在上一步中获得的结果合并到最终数据框中。
这是我的数据框的样子:
my_time id_orig_h id_orig_p id_resp_h id_resp_p
2018-06-18 02:04:03.967008 192.139.153.30 26949 40.97.131.114 443
2018-06-18 08:04:38.839383 192.139.153.30 42384 40.97.144.50 443
2018-06-18 19:13:15.984411 192.139.153.244 35178 40.97.114.130 443
2018-06-19 03:06:00.182532 192.139.153.30 35668 40.97.130.34 443
2018-06-19 03:43:38.484621 192.139.153.30 52845 40.97.130.18 443
2018-06-19 07:03:36.172746 192.139.153.30 24417 13.89.217.116 443
2018-06-19 07:18:55.593967 192.139.153.244 10887 40.97.114.130 443
2018-06-19 08:57:16.856116 192.139.153.30 34770 40.97.113.2 443
2018-06-19 09:02:10.184755 192.139.153.213 47535 212.92.47.81 443
2018-06-19 09:48:48.211221 192.139.153.30 43787 40.97.112.66 443
2018-06-19 10:45:06.545098 192.139.153.244 30875 40.97.130.210 443
2018-06-19 10:46:35.692965 99.233.53.244 55804 198.73.134.186 3544
2018-06-19 10:46:46.284706 99.233.53.244 56917 198.73.134.186 443
2018-06-19 11:11:15.796175 192.139.153.30 4529 204.225.107.168 7900
2018-06-19 11:42:20.410850 192.139.153.213 30654 52.112.64.158 443
2018-06-19 11:44:28.827162 192.139.153.213 30922 40.97.200.162 443
2018-06-19 11:44:30.530879 192.139.153.213 54614 40.97.200.162 443
2018-06-19 11:44:30.978958 192.139.153.213 35572 40.97.200.162 443
2018-06-19 11:44:33.910579 192.139.153.213 40321 40.97.200.162 443
2018-06-19 11:44:34.026077 192.139.153.213 35512 40.97.200.162 443
在此先感谢您的帮助。