熊猫:四舍五入到最近的一小时

时间:2018-03-29 17:29:14

标签: python pandas datetime-format python-datetime

我有一个带时间戳的列

 start_time: 
 0    2016-06-04 05:18:49
 1    2016-06-04 06:50:12
 2    2016-06-04 08:16:02
 3    2016-06-04 15:05:13
 4    2016-06-04 15:24:25

我想在start_time列上使用一个函数将分钟> = 30分钟到下一个小时。

 def extract_time(col):
      time = col.strftime('%H:%M')
      min= int(time.strip(':')[1])
      hour= int(time.strip(':')[0])
      if min >= 30:
           return hour + 1
      return hour

然后我想创建一个新的列'小时',其中包括舍入的小时:

 df['hour'] = df['start_time'].apply(extract_time)

我没有获得带有舍入时间的“小时”专栏,而是获得以下内容:

 0    <function extract_hour at 0x128722b90>
 1    <function extract_hour at 0x128722b90>
 2    <function extract_hour at 0x128722b90>
 3    <function extract_hour at 0x128722b90>
 4    <function extract_hour at 0x128722b90>

2 个答案:

答案 0 :(得分:5)

您可以使用以下矢量化解决方案:

In [30]: df['hour'] = df['start_time'].dt.round('H').dt.hour

In [31]: df
Out[31]:
           start_time  hour
0 2016-06-04 05:18:49     5
1 2016-06-04 06:50:12     7
2 2016-06-04 08:16:02     8
3 2016-06-04 15:05:13    15
4 2016-06-04 15:24:25    15

答案 1 :(得分:0)

试试这个:

df['start_time2'] = df['start_time'].dt.floor('h')

甚至是这样:

df['start_time2'] = df['start_time'].apply(lambda x: x.replace(minute=0, second=0))