说我有一个数据框'数据'已知日期范围称为' d_range' (大约1000天), 对于d_range中的每一天,我可能有1000个观察值,以下哪个更快,或者它们大致相同?
for day in d_range:
df = data[data.timestamp==day]
# do some operations on df
for day, df in data.groupby('timestamp'):
# do the same operations on df
这两种方法都可以根据数据创建视图。而不是副本?如果是这样,我的猜测是groupby操作有更多的开销成本,因为它需要首先聚合时间戳,是吗?