熊猫系列的日期时间到时间增量(秒)

时间:2020-02-05 08:32:21

标签: python pandas python-datetime timedelta

我的Pandas数据框具有日期时间的排序列:

print(df.Time)

返回

0      2019-10-30 13:14:49
1      2019-10-30 13:15:25
2      2019-10-30 13:32:44
               ...        
997    2020-02-04 13:53:35
998    2020-02-04 14:22:46
999    2020-02-04 14:52:43
Name: Time, Length: 1000, dtype: datetime64[ns]

我尝试的非常简单的事情是派生一个timedelta数组。 我尝试过:

df.Time[1:-1] - df.Time[0:-2]

结果为:

0         NaT
1      0 days
2      0 days
        ...  
996   0 days
997   0 days
998      NaT
Name: Time, Length: 999, dtype: timedelta64[ns]

结果长度正确,但是结果让我有些困惑。

似乎这不是对数据帧的2个子集执行操作的方法。

什么是正确的方法?是否有一个内置的方法可以从日期时间的排序列中生成时间增量?

预期的输出类似于:

0      35 seconds
1      1879 seconds
2      1720 seconds
        ...  
996    1805 seconds
997    1854 seconds
998    1791 seconds

2 个答案:

答案 0 :(得分:2)

示例数据框


0   2019-10-26 13:14:49
1   2019-10-30 13:16:49
2   2019-10-30 13:23:49
3   2019-10-30 13:32:49
4   2019-10-30 13:34:49
5   2019-10-30 13:45:49
6   2019-10-30 13:56:49
Name: Time, Length: 7, dtype: datetime64[ns]

您可以简单地使用内置的pandas diff函数来计算上一行同一列中DataFrame元素的差。

df.Time.diff() 

以下命令将导致:


0               NaT
1   4 days 00:02:00
2   0 days 00:07:00
3   0 days 00:09:00
4   0 days 00:02:00
5   0 days 00:11:00
6   0 days 00:11:00
Name: Time, dtype: timedelta64[ns]

答案 1 :(得分:0)

正如sammywemmy所说,您需要:

df1['delta'] = df1.Time - df1.Time.shift()

在虚拟数据帧上:

df1.head(15)
Out[50]: 
                  Time      delta
0  2019-10-30 13:15:55      NaT
1  2019-10-30 13:16:11 00:00:16
2  2019-10-30 13:16:27 00:00:16
3  2019-10-30 13:16:54 00:00:27
4  2019-10-30 13:17:22 00:00:28
5  2019-10-30 13:17:23 00:00:01
6  2019-10-30 13:17:29 00:00:06
7  2019-10-30 13:17:44 00:00:15
8  2019-10-30 13:17:46 00:00:02
9  2019-10-30 13:17:48 00:00:02
10 2019-10-30 13:18:47 00:00:59
11 2019-10-30 13:18:52 00:00:05
12 2019-10-30 13:18:53 00:00:01
13 2019-10-30 13:18:59 00:00:06
14 2019-10-30 13:19:07 00:00:08