大熊猫,按日期分组或循环日期更快?

时间:2017-06-21 14:43:35

标签: python pandas

说我有一个数据框'数据'已知日期范围称为' d_range' (大约1000天), 对于d_range中的每一天,我可能有1000个观察值,以下哪个更快,或者它们大致相同?

for day in d_range:
    df = data[data.timestamp==day]
    # do some operations on df

for day, df in data.groupby('timestamp'):
    # do the same operations on df

这两种方法都可以根据数据创建视图。而不是副本?如果是这样,我的猜测是groupby操作有更多的开销成本,因为它需要首先聚合时间戳,是吗?

0 个答案:

没有答案