从字符串到熊猫的timedelta

时间:2018-11-29 16:03:40

标签: python pandas timedelta

我有一个数据帧,其中时间戳的格式为HHHHH:MM

timestamp = pd.Series(['34:23','125:26','15234:52'], index=index)

我想将其转换为时间增量。

现在我设法在单个字符串上完成

str[:-3]
str[-2:]
timedelta(hours=int(str[:-3]),minutes=int(str[-2:]))

如果可能的话,我想将其应用于整个系列。是否存在?

谢谢

4 个答案:

答案 0 :(得分:2)

您可以使用按列的Pandas方法:

s = pd.Series(['34:23','125:26','15234:52'])

v = s.str.split(':', expand=True).astype(int)
s = pd.to_timedelta(v[0], unit='h') + pd.to_timedelta(v[1], unit='s')

print(s)

0     1 days 10:00:23
1     5 days 05:00:26
2   634 days 18:00:52
dtype: timedelta64[ns]

答案 1 :(得分:1)

这就是我要做的:

timestamp = pd.Series(['34:23','125:26','15234:52'])
x = timestamp.str.split(":").apply(lambda x: int(x[0])*60 + int(x[1]))
timestamp = pd.to_timedelta(x, unit='s')

答案 2 :(得分:1)

以秒为单位解析增量作为pd.to_timedelta的参数,

In [1]: import pandas as pd
In [2]: ts = pd.Series(['34:23','125:26','15234:52'])
In [3]: secs = 60 * ts.apply(lambda x: 60*int(x[:-3]) + int(x[-2:]))
In [4]: pd.to_timedelta(secs, 's')
Out[4]:
0     1 days 10:23:00
1     5 days 05:26:00
2   634 days 18:52:00
dtype: timedelta64[ns]

编辑:错过erncyp的答案也可以,但是您需要将pd.to_timedelta的参数乘以60,因为如果我没记错的话,分钟不能用来度量经过的时间,除了对前一小时取模。

答案 3 :(得分:1)

您可以使用pandas.Series.apply,即:

def convert(args):
    return timedelta(hours=int(args[:-3]),minutes=int(args[-2:]))
s = pd.Series(['34:23','125:26','15234:52'])
s = s.apply(convert)