我有一个带时间戳的列
start_time:
0 2016-06-04 05:18:49
1 2016-06-04 06:50:12
2 2016-06-04 08:16:02
3 2016-06-04 15:05:13
4 2016-06-04 15:24:25
我想在start_time列上使用一个函数将分钟> = 30分钟到下一个小时。
def extract_time(col):
time = col.strftime('%H:%M')
min= int(time.strip(':')[1])
hour= int(time.strip(':')[0])
if min >= 30:
return hour + 1
return hour
然后我想创建一个新的列'小时',其中包括舍入的小时:
df['hour'] = df['start_time'].apply(extract_time)
我没有获得带有舍入时间的“小时”专栏,而是获得以下内容:
0 <function extract_hour at 0x128722b90>
1 <function extract_hour at 0x128722b90>
2 <function extract_hour at 0x128722b90>
3 <function extract_hour at 0x128722b90>
4 <function extract_hour at 0x128722b90>
答案 0 :(得分:5)
您可以使用以下矢量化解决方案:
In [30]: df['hour'] = df['start_time'].dt.round('H').dt.hour
In [31]: df
Out[31]:
start_time hour
0 2016-06-04 05:18:49 5
1 2016-06-04 06:50:12 7
2 2016-06-04 08:16:02 8
3 2016-06-04 15:05:13 15
4 2016-06-04 15:24:25 15
答案 1 :(得分:0)
试试这个:
df['start_time2'] = df['start_time'].dt.floor('h')
甚至是这样:
df['start_time2'] = df['start_time'].apply(lambda x: x.replace(minute=0, second=0))