对于模糊的标题感到抱歉。这个问题更容易显示。
我有一个按时间排序的数据框。我想将此转换为总秒数。问题是时间从上午08:00:00到凌晨03:00:00。所以总时间是好的,直到时间从23:59:59到00:00:00。
一些时间戳的示例是:
['23:45:00'
'23:45:00'
'23:47:00'
'23:49:00'
'23:55:00'
'00:10:00'
'00:10:00'
'00:10:00'
'01:05:00'
'01:08:00'
'01:10:00'
'01:15:00'
'02:05:00'
'02:07:00'
'03:05:00'
'03:10:00'
'03:15:00'
'03:25:00']
所以总秒数可以到午夜。然后它又开始了。目前,我通过在午夜后24小时加入来修改此功能。
df['Time'] = pd.DatetimeIndex(df['Time']) + timedelta(hours=24)
如果您必须索引相应的行,然后添加n个小时,那么所有这些都不是非常有效。
我不确定这是否有用,但我附上了一些产生以下随机时间戳的代码:
import pandas as pd
import random
from datetime import timedelta
def randomTime():
rtime = int(random.random()*86400)
hours = int(rtime/3600)
minutes = int((rtime - hours*3600)/60)
seconds = rtime - hours*3600 - minutes*60
time_string = '%02d:%02d:%02d' % (hours, minutes, seconds)
return time_string
time = [randomTime() for _ in range(8)]
k = 5
N = 8
d = ({'Time' : (time)})
df = pd.DataFrame(data=d)
答案 0 :(得分:2)
我完全赞同@ abarnet的评论,你应该每次增加24小时,而不是25小时。
使用上面的例子,找到增量的有效方法可能是
>>> (pd.to_datetime(df.Time) < pd.to_datetime(df.Time).shift(1)).cumsum() * pd.Timedelta(hours=24)
0 0 days
1 0 days
2 0 days
3 0 days
4 0 days
5 1 days
6 1 days
7 1 days
8 1 days
9 1 days
10 1 days
11 1 days
12 1 days
13 1 days
14 1 days
15 1 days
16 1 days
17 1 days
Name: Time, dtype: timedelta64[ns]
这个