我的Pandas数据框具有日期时间的排序列:
print(df.Time)
返回
0 2019-10-30 13:14:49
1 2019-10-30 13:15:25
2 2019-10-30 13:32:44
...
997 2020-02-04 13:53:35
998 2020-02-04 14:22:46
999 2020-02-04 14:52:43
Name: Time, Length: 1000, dtype: datetime64[ns]
我尝试的非常简单的事情是派生一个timedelta数组。 我尝试过:
df.Time[1:-1] - df.Time[0:-2]
结果为:
0 NaT
1 0 days
2 0 days
...
996 0 days
997 0 days
998 NaT
Name: Time, Length: 999, dtype: timedelta64[ns]
结果长度正确,但是结果让我有些困惑。
似乎这不是对数据帧的2个子集执行操作的方法。
什么是正确的方法?是否有一个内置的方法可以从日期时间的排序列中生成时间增量?
预期的输出类似于:
0 35 seconds
1 1879 seconds
2 1720 seconds
...
996 1805 seconds
997 1854 seconds
998 1791 seconds
答案 0 :(得分:2)
示例数据框
0 2019-10-26 13:14:49
1 2019-10-30 13:16:49
2 2019-10-30 13:23:49
3 2019-10-30 13:32:49
4 2019-10-30 13:34:49
5 2019-10-30 13:45:49
6 2019-10-30 13:56:49
Name: Time, Length: 7, dtype: datetime64[ns]
您可以简单地使用内置的pandas diff函数来计算上一行同一列中DataFrame元素的差。
df.Time.diff()
以下命令将导致:
0 NaT
1 4 days 00:02:00
2 0 days 00:07:00
3 0 days 00:09:00
4 0 days 00:02:00
5 0 days 00:11:00
6 0 days 00:11:00
Name: Time, dtype: timedelta64[ns]
答案 1 :(得分:0)
正如sammywemmy所说,您需要:
df1['delta'] = df1.Time - df1.Time.shift()
在虚拟数据帧上:
df1.head(15)
Out[50]:
Time delta
0 2019-10-30 13:15:55 NaT
1 2019-10-30 13:16:11 00:00:16
2 2019-10-30 13:16:27 00:00:16
3 2019-10-30 13:16:54 00:00:27
4 2019-10-30 13:17:22 00:00:28
5 2019-10-30 13:17:23 00:00:01
6 2019-10-30 13:17:29 00:00:06
7 2019-10-30 13:17:44 00:00:15
8 2019-10-30 13:17:46 00:00:02
9 2019-10-30 13:17:48 00:00:02
10 2019-10-30 13:18:47 00:00:59
11 2019-10-30 13:18:52 00:00:05
12 2019-10-30 13:18:53 00:00:01
13 2019-10-30 13:18:59 00:00:06
14 2019-10-30 13:19:07 00:00:08