如何有效地订购时间python

时间:2018-05-12 07:24:33

标签: python pandas time timedelta

对于模糊的标题感到抱歉。这个问题更容易显示。

我有一个按时间排序的数据框。我想将此转换为总秒数。问题是时间从上午08:00:00到凌晨03:00:00。所以总时间是好的,直到时间从23:59:59到00:00:00。

一些时间戳的示例是:

['23:45:00'
'23:45:00'
'23:47:00'
'23:49:00'
'23:55:00'
'00:10:00'
'00:10:00'
'00:10:00'
'01:05:00'
'01:08:00'
'01:10:00'
'01:15:00'
'02:05:00'
'02:07:00'
'03:05:00'
'03:10:00'
'03:15:00'
'03:25:00']

所以总秒数可以到午夜。然后它又开始了。目前,我通过在午夜后24小时加入来修改此功能。

df['Time'] = pd.DatetimeIndex(df['Time']) + timedelta(hours=24)

如果您必须索引相应的行,然后添加n个小时,那么所有这些都不是非常有效。

我不确定这是否有用,但我附上了一些产生以下随机时间戳的代码:

import pandas as pd
import random
from datetime import timedelta

def randomTime():

    rtime = int(random.random()*86400)

    hours   = int(rtime/3600)
    minutes = int((rtime - hours*3600)/60)
    seconds = rtime - hours*3600 - minutes*60

    time_string = '%02d:%02d:%02d' % (hours, minutes, seconds)
    return time_string

time = [randomTime() for _ in range(8)]

k = 5
N = 8

d = ({'Time' : (time)})

df = pd.DataFrame(data=d)

1 个答案:

答案 0 :(得分:2)

我完全赞同@ abarnet的评论,你应该每次增加24小时,而不是25小时。

使用上面的例子,找到增量的有效方法可能是

>>> (pd.to_datetime(df.Time) < pd.to_datetime(df.Time).shift(1)).cumsum() * pd.Timedelta(hours=24)
0    0 days
1    0 days
2    0 days
3    0 days
4    0 days
5    1 days
6    1 days
7    1 days
8    1 days
9    1 days
10   1 days
11   1 days
12   1 days
13   1 days
14   1 days
15   1 days
16   1 days
17   1 days
Name: Time, dtype: timedelta64[ns]

这个

  • 检查相对于
  • 之前的行的时间是否下降
  • 查找此次发生的累计次数
  • 将其翻译为24小时的时间值