我想让每个小时或一天的所有行都做一些计算。 所以我的意思是如何遍历数据帧并过滤一个小时的行,进行计算然后移至下一个小时
问题:如何获取每小时或每天的行数?
df
Date TimeStamp col1
20150102 20:00:00 SomeData
20150102 20:01:00 SomeData
20150102 20:02:00 SomeData
20150102 20:03:00 SomeData
20150102 20:04:00 SomeData
20150102 20:05:00 SomeData
for index, row in df.iterrows():
#grouping these rows of a min/an hour and do some calculations based on these rows
答案 0 :(得分:0)
您应该使用熊猫groupby
按小时/天对行进行分组,然后才能对其他列进行计算。
将小时/天数提取到另一列中将类似于:
df['Hour'] = df['TimeStamp'].dt.hour
df['Day'] = df['Date'].dt.day
之后,您将与之分组:
df.groupby('Hour')...
df.groupby('Day')...