如何使用pandas计算最大点击间隔?

时间:2016-11-06 00:28:03

标签: python pandas machine-learning bigdata

我有这样的数据集,它指示IP何时点击链接:

ip time

我想计算每个不同IP的最大点击间隔。

有没有这样做?

1 个答案:

答案 0 :(得分:1)

如果我理解了您的问题,那么您正在寻找以下内容。

import pandas as pd

df = pd.DataFrame({'ip':[1,1,1,1,1,2,2,2,2],
                   'time':pd.date_range('01-15-16 12:00:00',
                   periods=9)})
df_grp = df.groupby('ip')['time'].apply(lambda x: x.max() - x.min())

计算与IP关联的第一次和最后一次点击之间的时差。